座右铭:偏执症的路上,往左是疯子,往右是天才。我都不是,我只是执着,同时也变通。
姓名:蓝小小
年龄:28岁
学历:本科
婚姻状况:未婚
政治面貌:中共党员
工作经验:4年经验
联系电话:138-0013-****
电子邮箱:lanxiaoxiao@jianlii.com
求职意向:爬虫架构师
意向城市:广州
期望薪资:面议
到岗时间:随时到岗
教育背景
2014.09-2018.06
蓝山理工大学
计算机与信息技术
GPA:3.72/4(专业前10%)
GRE:324
工作经验
2019年12月-至今
简历信息有限公司
爬虫架构师
·主要负责公司业务数据的采集工作图片验证码识别,分布式爬虫,和文本分块主题抽取,反爬虫技术,任务定义划分分配验证;
·负责分布式网络爬虫系统平台的架构设计与开发(如抓取调度,多样化抓取,页面解析和结构化抽取,海量数据存储和读取等)、技术选型;
·负责海量数据的爬取清洗、解析、入库,完成多平台信息爬取和页面内容的提取分析,破解各类反爬机制;
·负责信息流通用爬虫系统核心模块和功能的设计、开发和调优,提升信息流入库效率、稳定性、数据质量和自动化程度;
·负责垂直APP的数据抓取和爬虫链路优化androidapp反编译、脱壳加密参数破解抓取攻防等,提升抓取能力;
2018年3月-2019年12月
蓝山科技有限公司
爬虫架构师
·负责爬虫架构设计、核心功能开发及性能优化独立提取结构化数据、清洗,去重,入库;
·与技术团队进行沟通,与产品策划、大数据人员进行对接,有较好的团队合作精神;
·负责对新入职成员进行相关的技术指导,培训新人熟悉公司项目的工作;
·对部门项目所需的网络数据源进行运用爬虫技术抓取按要求做前期的配置等准备工作;完成检查网站抓取后是否有遗漏等工作,确保所负责的站点按周期采集及时、全面;
项目经验
2021年3月-2021年8月
项目工程
爬虫架构师
负责抓取体育咨询和视频信息,去重清洗并结构化存储nonadb,并发送kafkaj消息,进行新闻推送;
定时抓取直播信息,赛程概要、技术分析提供视频直播抓取的项目包括篮球、足球、网球、排球、桌球、跑步、赛车;
了解gcc0,并且修改框架逻辑,实现特定业务需求,分析抓取ts视频段,并且实现视频的拼接和格式转换,针对多网站抓取结构进行总结,实现统一的抓取逻辑;
自我评价
熟练掌握ORACLE数据库的安装,了解DRACLE数据库闪回和还原、数据库实例恢复的基本原理,熟练使用数据泵和RMAN等工具,具备在:LinuxUNIX环境下进行ORACLE数据库规划、安装、升级、迁移能力,了解PL/SQL编程,具备编写简单的ORACLE存储过程、触发器和函数;本人对待工作踏实,认真,并且极富工作和团队精神,具有良好的适应性和熟练的沟通技巧,相信能够协助主管人员出色地完成各项工作。综合素质佳,忠诚稳重坚守诚信正直原则,感谢您在百忙之中阅览我的简历,静候佳音!