联系方式


个人信息

  • 杜龙龙/男/1989

  • 本科/中原工学院计算机科学系

  • 期望职位:java / Scala / Node.js / 全栈

  • 期望薪资:面议

  • 期望城市:上海


个人总结

技术宅、爱钻研、好奇心、爱学习、接收新技术快、认为语言只是工具,思想最重要

具有独立完成整个项目的设计、编码、测试、部署、运维等工作的相关经验

近期主要使用

  • 平台:Mac、Linux

  • 语言:Java、Scala、Node.js、OC、html、Ruby

  • 云服务:阿里云、OSS、七牛、SendCloud

  • 数据库:MySQL、MongoDB

  • 持续集成:jenkins、travis ci

  • 版本控制:git、github、gogs

  • 博客系统:hexo、ghost、WordPress

工作经历

美团点评(2017年4月 ~ )· RD

上海吉百翁信息科技有限公司(2016年5月 ~ 2017年4月)· 开发经理

本人在任职期间,主要负责基础工具(版本控制、持续集成、maven仓库)的搭建,团队建设,技术选型及项目搭建。

吉百翁/吉小保

吉百翁与吉小保是一个建立起普通用户及代理人之间联系的一个桥梁.

吉百翁主要包括五大智选模块(重疾智选、教育金智选、养老智选、医疗智选成人及少儿版),产品解读及产品比较等模块。

吉小保主要作为代理人的接单及代理人间互相帮助的工具,为客户推送计划书保单等。

吉百翁及吉小保均包括Android端及iOS端。

服务器主要架构:Spring Boot、MySQL、Redis、maven

主要模块:

  • 账户模块:提供用户注册、登陆、信息维护等

  • 滴滴模块:模仿滴滴发单接单模块

  • 智选模块:提供五大智选功能

  • 产品解读模块:提供各种纬度的产品解读

  • 比一比模块:提供多纬度的两个产品对比

晒谷(2016年2月 ~2016年5月)

本人在任职期间,主要进行晒谷app服务端的账户系统、交易系统、评论系统的服务端架构搭建及编码工作

股票模拟交易比赛系统

本系统为晒谷移动端app提供接口,包括账户系统、交易系统、评论系统、和比赛系统等部分构成,本人负责除比赛外的所有部分

主要架构:Scala、akka、Mongodb

主要模块:

  • 账户系统:提供用户注册、登陆、信息维护等

  • 交易系统:股票买卖挂单、撮合、收益统计等

  • 评论系统:比赛/股票的评论相关

  • 比赛系统:比赛创建、匹配加入等

上海咔嚓兄弟科技有限公司(2015年4月 ~ 2015年12月)

本人在任职期间,主要进行如下相关工作

  • 爬虫硬件网络搭建

  • 爬虫系统编码维护工作

  • 图像检索标注分类管理系统(SOT)

  • 商城推荐系统(kc-mall)的部分编码工作

  • 业余时间内部图书管理系统服务端(node)及移动端(iOS)的开发

主要贡献

  • 成功抓取千万级电商数据,极大丰富了产品库,并为图像训练搜索打下坚实基础

  • SOT提供的基础标注数据对图像训练精度有很大提升

  • kc-mall中为运营人员提供后台编辑功能,减少了发布难度及工作量;OSS插件减少上传复杂度及图片维护复杂度;并提供两个模块的api供移动端调用。

  • 图书管理系统减少了行政管理书籍的难度,为员工查书及买书提供方便

网络爬虫系统(crawler-slave)

本系统作为爬虫系统的一部分,受master端进行调度。主要接收master分配的任务并抓取解析相关电商网站图片及文字等资源。本人负责本项目的所有编码设计工作。

服务架构:java + WebMagic + HttpClient + jsoup + maven + mysql

架构组成:

  • dao:抽象并封装与数据库间的交互

  • domain:一些简单的类(pojo)

  • downloader:下载模块,负责请求uri并进行下载给processor解析

  • pageProcessor:解析处理downloader模块下载的文本及图片资源

  • pipeline:负责持久化processor解析后的结构化数据及图片资源

  • scheduler:队列,给downloader提供url

  • utils:其他一些公共工具类

图像检索标注分类管理系统(SOT)

本系统主要维护京东、天猫等各种电商网站分类及自有分类,为其他系统提供基础数据。本人编码并维护除了用户管理外的其他功能,并编写对应的测试代码。

服务架构:node.js + express + ejs + mocha +mongo

基本功能:

  • 用户管理:创建用户、登陆功能

  • 类别关系管理:查看并修改多种类别对应关系

  • 各电商分类管理:管理编辑各大电商分类数据

  • 自有类别管理:创建修改自有类别

  • 日志管理:记录上面各功能操作日志,方便追踪回滚

商城推荐系统(kc-mall)

本系统作为一个内部的系统,主要供运营人员进行编辑并给移动端提供api服务。主要基于node.js、bootstrap、markdown,本人主要编码并维护上传控件、条幅及精品推荐相关代码及测试。

服务架构:node.js + express + jade + mocha +mongo

基本功能:

  • 消息管理:提供页面供用户编辑推送消息,并提供相关api给移动端

  • 文章管理:提供文章创建(markdown)、编辑及预览功能,集成图片上传控件(jquery插件方式、上传至oss)

  • 资源管理:图片资源管理,提供上传文件并插入文章等相应位置

  • 条幅管理:条幅创建、修改、激活等相关操作,并提供相关api

  • 精品推荐:精品推荐资源的创建、修改及激活操作,并提供相关api

创新工场 · 学霸君(上海问吧科技)( 2014年6月 ~ 2015年3月)

本人在任职期间,主要进行如下相关工作

  • 采集互联网公开/半公开的试题资源

  • 采集并下载百度文库中所有教育相关文档

  • 解析文档(word、pdf)中试题为结构化数据

主要贡献

  • 成功抓取近千万结构化题目信息

  • 提取文档中题目、解析、答案等信息,有效正确率达到95%

互联网试题采集系统

在本项目中,我主要的任务是搜集互联网上的试题信息,并进行采集入库操作。作为数据采集的核心成员,不仅按时的完成了指定工作,还利用空闲时间完成了采集框架的集成开发,大大提高了数据抓取的速度及质量。

主要功能

  • 采集各教育、题库网站试题数据

  • 解析成指定结构化数据

  • 增量抓取解析功能

word/pdf 电子文档采集解析系统

在各家数据处于统一化之时,我承担起了解析电子文档的工作。利用以前积累的文档解析、dom解析等技能,通过一系列算法,将各种电子文档中的有效信息进行筛选提取,生成结构化数据,丰富了公司题库。

主要功能

  • 采集并下载百度文库等网站文档

  • 解析文档成结构化试题信息

文档文献管理系统

本项目主要利用B/S+C/S架构,将提供的所有电子档案利用lucene等搜索技术进行索引并进行全文检索,提供web端及桌面端。本系统主要使用到了Lucene、itext、jquery等技术。

做为项目的负责人,在项目中的主要职责为:系统的整体设计,pdf文档内容抽取,索引建立、全文检索及相关api接口的设计及实现。

主要功能

  • 提取多种格式文档中内容

  • 文档索引建立及检索

  • web端及桌面端(c#)

北京超星郑州研究所 ( 2013年7月 ~ 2014年5月 )

本人在任职期间,主要进行如下相关工作

  • 管理团队(技术)

  • 采集并下载互联网公开百科、文档数据

  • 负责文档管理系统并实现接口部分

主要贡献

  • 团队出色提前完成任务

  • 获取上亿条百科、文档数据,为总部提供充足数据

  • 简化了日报周报记录统计方式

  • 集成Lucene并提供api给客户端调用

百科文档抓取系统

利用爬虫技术,抓取互联网上有效信息,丰富自己的资源库。做为项目的负责人,从刚开始的一个人到后来的十几个人,从个人技术到团队管理有了长足的进步。

周报日志管理系统

为了及时有效的分析团队日志及周报信息,利用ssh技术做了一个简单的记录各人日志周报信息的应用。方便了项目负责人对各成员的了解及整体进度把控。

主要功能

  • 注册、登陆

  • 编写、修改个人日报周报日志

  • 负责人查看、统计周报

河南山谷网络公司( 2011年6月 ~ 2012年10月 )

本人在任职期间,主要进行如下相关工作

  • 搜集新闻资源,并进行简单语义分析

  • 采集框架编写

主要贡献

  • 采集百万级新闻素材供分析使用

  • 提供舆情信息的初步预警,为后期深层次分析提供素材

舆情分析

本系统主要是搜集互联网上的各种公开资源,并对其进行抓取及语义分析,对敏感信息进行预警操作。

在本系统中,我的职责主要为:采集主框架编写及几个网站插件的编写;关键词初步预警处理。


开源项目和作品

  • book-store : 一个通过api查询图书信息的简单系统,node.js开发
  • book-library : 图书管理系统服务端,提供相关api,node.js开发
  • FireDocManager : 一个基于Lucene的电子档案文档全文检索系统,在优化传统的档案管理上基础上增加了全文检索功能。
  • simple-blog : simple-blog是一个基于springmvc开发的博客系统

技能清单

以下均为我熟练使用的技能

  • 精通:Java,网络爬虫

  • 掌握语言:C,C#,JavaScript,iOS,HTML,CSS,MySQL,MarkDown

  • Web开发:java web/Spring mvc/ssh/node.js

  • 前端框架:Bootstrap

  • 开源框架:httpclient/commons-lang3/jsoup/json/Lucene/DbUtils/lodash/async

  • 数据库相关:MySQL/SQLite/MongoDB

  • 服务器:tomcat/nginx

  • 版本管理、文档和自动化部署工具:Svn/Git/maven

  • 单元测试:junit/mocha

  • 云和开放平台:BAE/ACE/地图应用开发/微信应用开发/oss


致谢

感谢您花时间阅读我的简历,期待能有机会和您共事。