jeff dean的主页

https://ai.google/research/people/jeff/

上面有他的很多论文和ppt
很不错

我于1999年中期加入Google,目前是研究小组的Google高级研究员,负责Google Brain项目。我感兴趣的领域包括大型分布式系统,性能监控,压缩技术,信息检索,机器学习在搜索和其他相关问题中的应用,微处理器体系结构,编译器优化以及新产品的开发,这些新产品以新颖有趣的方式组织了现有信息。方法。在Google期间,我从事以下项目:
Google广告服务系统初始版本的设计和实现。
我们五代爬网,索引和查询服务系统的设计和实现,涵盖了搜索文档数量,每秒处理的查询数量以及系统更新频率的两个和三个数量级的增长。我最近在WSDM'09上发表了有关构建大型检索系统(幻灯片)的一些问题的演讲。
Google的AdSense内容广告产品的初步开发(涉及生产服务系统的设计和实施,以及基于页面内容开发和提高广告选择质量的工作)。
协议缓冲区的开发,一种以有效但可扩展的格式对结构化数据进行编码的方法,以及一种可生成方便的包装器以使用多种语言处理对象的编译器。Google几乎在所有RPC协议中广泛使用协议缓冲区,并在各种持久性存储系统中存储结构化信息。协议缓冲区实现的一个版本已开源,可从http://code.google.com/p/protobuf/获得。
Google新闻产品的某些初始生产服务系统可以与克里希纳·巴拉特(Krishna Bharat)合作,将他组装的原型系统移至已部署的系统中。我们的搜索排名算法的某些方面,尤其是改进了处理诸如锚文本之类的页面外信号的处理。
我们第一代用于管理机器集群的自动化作业调度系统的设计和实现。
快速开发和试验新排名算法的原型基础架构的设计和实现。
MapReduce的设计和实现,该系统可简化大规模数据处理应用程序的开发。关于MapReduce的论文出现在OSDI'04中。
BigTable的设计和实现,BigTable是在许多Google产品之下使用的大型半结构化存储系统。关于BigTable的论文发表在OSDI'06中。
Google Translate(我们的统计机器翻译系统)的一些生产系统设计。特别是,我设计并实现了一个用于分布式高速访问非常大的语言模型(太大而无法容纳在一台机器上的内存)的系统。
一些内部工具可简化快速搜索我们内部源代码存储库的过程。这个内部工具产生的许多想法都整合到了我们的Google代码搜索产品中,其中包括使用正则表达式搜索大量源代码的功能。
用于大规模培训和部署深度学习模型的两代系统的设计和实现:DistBelief和TensorFlow。TensorFlow现在是一个开源项目,托管在GitHub上。

上一篇:Percolator:基于BigTable的分布式事务实现


下一篇:c-如何在QTableView中设置特定单元格的线条样式?