鬼谷子叔叔

跟福哥学编程吧~~

Python做个搜索引擎(7)网页蜘蛛代码编写(三)【20201013】
介绍介绍福哥更新了Spider对象,实现了爬取网页内容,分析网页数据,写入数据库这些功能。实现了这些功能之后网页蜘蛛的基本功能也就差不多完成了!后面就可以开始编写搜索引擎的前端UI功能了,相对网页蜘蛛来说,搜索引擎前端UI就比较简单了!但是,网页蜘蛛是搜索引擎的基础,只有采集到足够多的数据,搜索引擎才可以在也会查询的时候返回用户想看到...
阅读 102
Python编程中的字符串编码转换问题【20201012】
介绍介绍福哥今天给大家讲讲关于Python编程中的字符串编码转换的问题,这个问题在初学者编程时候会经常遇到,如果要弄清楚这里面的道道,还是需要好好学习一下的什么是编码所谓编码就是计算机标记一个汉字(或者是其他国家的文字)对应的数字,在不同编码里同样的一个汉字会对应不同的数字,比如:“福哥”在gbk编码里对应的是“205 172 184...
阅读 120
Python做个搜索引擎(6)网页蜘蛛代码编写(二)【20201011】
介绍介绍上一堂课福哥给大家展示了一个半成品的蜘蛛对象Spider,今天我们继续。做事要有目标,并努力使之达成!今天我们的目标就是:实现网页的爬取分析并将内容保存到webpages数据表当中;将提取出来的子级页面的超链接保存到webpages里面;Spider对象福哥对Spider对象的功能进行了完善,包括一些新的方法(函数)的定义和一...
阅读 98
Python做个搜索引擎(5)网页蜘蛛代码编写(一)【20201010】
介绍介绍昨天我们明白了网页蜘蛛的工作原理,今天就可以开始根据这个原理进行代码的编写了。虽然python也可以编写面向过程的程序,但是使用面向对象的方式编写程序是一个好的习惯,它更加可以满足各种复杂的业务逻辑的需要,同时代码也更容易读懂。福哥要先开发网页蜘蛛程序,所以先建立一个Spider对象,用它来实现网页蜘蛛的全部功能。Spider...
阅读 126
Python做个搜索引擎(4)网页蜘蛛之工作原理【20201009】
介绍介绍前面几堂课我们已经掌握了通过Python编程操作MySQL数据库和ElasticSearch搜索引擎的技巧,今天开始就可以正式编写代码了。搜索引擎分为两个部分,一个是网页蜘蛛,负责爬取网站的网页内容并且存入MySQL数据库当中,同时同步写入到ElasticSearch搜索引擎里面;另外一个是搜索界面,负责从ElasticSea...
阅读 77
Python操作MySQL数据库【20201007】
介绍介绍今天我们学习如何通过Python操作MySQL数据库。学会使用Python操作MySQL数据库之后,我们就可以使用Python制作更为强大的应用程序了。有了数据库操作能力的应用程序,就有了数据存档的能力,能够存档的程序可以达到的功能就非常多了。在Python2.7下使用的是pymysql这个软件包,这个pymysql库的原生对...
阅读 84
Python做个搜索引擎(3)ElasticSearch数据库设计【20201006】
介绍介绍我们已经设计好了搜索引擎的MySQL数据库,今天我们要开始设计ElasticSearch数据库了。ElasticSearch数据库在这个搜索引擎项目里的作用是全文检索,因为MySQL无法实现这个功能。而搜索引擎的特点是用户给出一个查询关键字,我们根据这个关键字进行全文匹配查找符合条件的文档出来返回给用户。也就是说我们只需要考虑...
阅读 136
Python做个搜索引擎(2)MySQL数据库设计【20201005】
介绍介绍昨天我们已经设计好了搜索引擎的模型,搜索引擎包括两个基本模型即:网站和网页。那么接下来我们就要针对这两个模型进行数据库的设计了。设计数据库要考虑的问题很多,包括数据的大小、字段的数量、读取场景,写入场景等等。除此之外还要考虑使用什么数据库引擎,因为不同的数据库引擎的特长是不一样的,我们要充分利用它们的这些特长之处,来将我们的项...
阅读 100
Python做个搜索引擎(1)模型设计【20201004】
介绍介绍今天开始福哥将会带着童鞋们做项目了,虽然我们之前介绍了c/c++、java、php、python等等很多种编程语言,这些编程语言也可以独立完成一些项目的开发任务,但是如果要做出一个好项目,一般情况下只靠一种编程语言是不够的,所以福哥在带着大家做项目的时候,会同时将几种编程语言都用起来。我们的第一个项目叫做搜索引擎,就是模仿百度...
阅读 105
mysql5.7.28安装笔记【20200921】
介绍介绍如果编写一个小工具、小游戏,可以直接写代码,它不涉及存储数据的操作,不过如果要编写一个网络工具、系统平台、网络游戏就需要将大量的数据存储起来。早期存储数据都是使用文件存储,不过使用文件作为存储媒介是非常有局限性了。首先文件是独立的,很难进行统计操作;其次文件依赖IO句柄,频繁的进行打开文件、关闭文件,会对系统资源造成影响。这时...
阅读 221
 

鬼谷子叔叔

日志
212
浏览
1626