本篇文章主要讲述Python语言之概述面试题,希望阅读本篇文章以后大家有所收获,帮助大家对相关内容的理解更加深入。
第1题: 如何解决验证码的问题,用什么模块,听过哪些人工打码平台?
PIL、pytesser、tesseract模块 平台的话有:(打码平台特殊,不保证时效性)
·云打码
·挣码
·斐斐打码
·若快打码
·超级鹰
第2题: ip 被封了怎么解决,自己做过 ip 池么?
关于 ip 可以通过 ip 代理池来解决问题 ip 代理池相关的可以在 github 上搜索 ip proxy 自己选一个去说 https://github.com/awolfly9/IPProxyTool 提供大体思路:
获取器 通过 requests 的爬虫爬取免费的 IP 代理网址获取 IP。
过滤器通过获取器获取的代理请求网页数据有数据返回的保存进 Redis。
定时检测器定时拿出一部分 Proxy 重新的用过滤器进行检测剔除不能用的代理。
利用 Flask web 服务器提供 API 方便提取 IP
第3题: 在 Python 中,list,tuple,dict,set 有什么区别,主要应用在什么场景?
区别
llist:链表,有序的数据结构, 通过索引进行查找,使用方括号”[]”;
ltuple:元组,元组将多样的对象集合到一起,不能修改,通过索引进行查找, 使用括号”()”;
ldict:字典,字典是一组键(key)和值(value)的组合,通过键(key)进行查找,没有顺序, 使用大括号”{}”;
lset:集合,无序,元素只出现一次, 自动去重,使用”set([])”
应用场景
llist:简单的数据集合,可以使用索引;
ltuple:把一些数据当做一个整体去使用,不能修改;
ldict:使用键值和值进行关联的数据;
lset:数据只出现一次,只关心数据是否出现, 不关心其位置。
第4题: 请描述方法重载与方法重写?
方法重载
是在一个类里面,方法名字相同,而参数不同。返回类型可以相同也可以不同。
重载是让类以统一的方式处理不同类型数据的一种手段。
方法重写
子类不想原封不动地继承父类的方法,而是想作一定的修改,这就需要采用方法的重写。方法重写又称方法覆盖。
第5题:是否了解线程的同步和异步?
线程同步:多个线程同时访问同一资源,等待资源访问结束,浪费时间,效率低
例子:你说完,我再说。
线程异步:在访问资源时在空闲等待时同时访问其他资源,实现多线程机制
你喊朋友吃饭,朋友说知道了,待会忙完去找你 ,你就去做别的了。
第6题:是否了解网络的同步和异步?
同步:提交请求->等待服务器处理->处理完毕返回,这个期间客户端浏览器不能干任何事
异步: 请求通过事件触发->服务器处理(这是浏览器仍然可以作其他事情)->处理完毕
第7题:你是否了解MySQL数据库的几种引擎?
这个答案比较发散,可以重点说下面两种
InnoDB
InnoDB是一个健壮的事务型存储引擎,这种存储引擎已经被很多互联网公司使用,为用户操作非常大的数据存储提供了一个强大的解决方案。
在以下场合下,使用InnoDB是最理想的选择:
更新密集的表。InnoDB存储引擎特别适合处理多重并发的更新请求。
事务。InnoDB存储引擎是支持事务的标准MySQL存储引擎。
自动灾难恢复。与其它存储引擎不同,InnoDB表能够自动从灾难中恢复。
外键约束。MySQL支持外键的存储引擎只有InnoDB。
支持自动增加列AUTO_INCREMENT属性。
一般来说,如果需要事务支持,并且有较高的并发读取频率,InnoDB是不错的选择。
MEMORY
使用MySQL Memory存储引擎的出发点是速度。为得到最快的响应时间,采用的逻辑存储介质是系统内存。虽然在内存中存储表数据确实会提供很高的性能,但当mysqld守护进程崩溃时,所有的Memory数据都会丢失。获得速度的同时也带来了一些缺陷。
一般在以下几种情况下使用Memory存储引擎:
目标数据较小,而且被非常频繁地访问。在内存中存放数据,所以会造成内存的使用,可以通过参数max_heap_table_size控制Memory表的大小,设置此参数,就可以限制Memory表的最大大小。
如果数据是临时的,而且要求必须立即可用,那么就可以存放在内存表中。
存储在Memory表中的数据如果突然丢失,不会对应用服务产生实质的负面影响。