数据驱动商业变革,创新引领行业未来。
2019年5月8日-5月10日,由IT168旗下ITPUB企业社区平台主办的第十届中国数据库技术大会(DTCC 2019),将在北京市新云南大酒店召开。本次大会将以“数据风云,十年变迁”为主题,采用“3+2”模式。即3天传统技术演讲+2天深度主题培训。大会设置了超过100场的主题演讲;另外,为了深化数据领域的项目落地,还提供了2天的深度课程培训。
中国数据库技术大会已经成功举办了九届,DTCC 2019是第十届。十年的风雨同舟,十年的相濡以沫!DTCC已成为中国数据库领域最具影响力品牌,是CIO/CTO、数据库系统管理员、DBA经理/主管,数据库架构师、数据分析师及系统管理员等人群的饕餮大餐。
AI与大数据应用、云时代的数据库,NoSQL 技术与实践,金融行业数据库实践、NewSQL 分布式数据库实践……DTCC 数据库技术大会的议题设置,涉及与数据相关的各个层面,包括:数据架构、数据分析、数据治理等。其中,AI与大数据应用专场,是此次大会的重点,为了提高议题的深度和广度,组委会特设置了上、下两个专场,分别于5月8日和5月9日下午,与您共聚一堂,共话行业未来!
在过去几年,大数据行业的发展已足够成熟,大数据落地案例随处可见;而最新的AI技术,则是大数据发展的助推器,把大数据推向一个新的顶峰。进入2018年以后,AI和大数据融合趋势明显,未来可能会成为企业挖掘商业价值的最大推动力。过去,企业数据可用性不高,样本容量也有限,无法在毫秒内分析大量数据;而人工智能和机器学习技术,让企业在数据容量和数据源可用性方面有了质的飞越,才有了真正的大数据访问和实时处理能力。同样,人工智能技术虽然已经存在了几十年,但是直到现在,当人们有了更强大的数据采集、存储、计算能力后,才获得了更先进的算法和机器学习模型。
把人工智能和大数据技术结合在一起,将带来意想不到的商业价值。以瓜子二手车为例,虽然二手车行业广告营销非常密集,但是品牌广告的获客能力已达到瓶颈,存量市场的用户运营变得愈发重要。大数据时代,企业可以轻而易举地获取大量的用户数据,比如用户的登录/注册时间、搜索/浏览了哪些车源、实地查看了哪些车源等等。有了这些数据,再结合人工智能和机器学习算法,企业能够深入分析和挖掘用户的特征和偏好,并针对不同的用户进行个性化的精细运营。届时,瓜子二手车资深研发工程师周家帅,将参加DTCC2019 数据库大会,全面分享大数据和人工智能在瓜子精细化运营平台中的应用实践和落地经验。
通过新一代信息技术推动用户增长,这也是快手能把竞争对手甩出几条街的根本原因。前快手增长技术负责人张翼认为,用户增长(user growth)和增长黑客(growth hacking)不仅是一个炙手可热的话题,更是全新的组织方式和企业推进方式。用户增长,强调以数据和技术为驱动力,通过多角色的增长团队,做快速、极致的小步迭代,从而提升用户的增长速度、留存和活跃度;而增长黑客,则依赖技术新渠道、大数据与数据分析,来实现快速测试产品开发及营销的新想法,也是一种利用用户行为数据验证或寻求演进的科学方法。简单理解,这两种方法打破了传统市场,传播,产品,运营和技术的界限,让用户社交和分享得到高度重视,让现有用户来不断带来新用户。那么,当用户增长以及增长黑客遇到了人工智能,将碰撞出怎样的火花?在5月8日的数据库技术大会上,张翼将具体介绍人工智能,深度学习,个性化推荐等技术,如何帮助一家互联网企业实现用户的增长和产品提升。
人工智能和大数据技术带来了强大的获客能力,腾讯也是最大的获益者。“腾讯广告系统每天有上百亿次请求量,以及上百T的数据,为保证数据流的稳定可靠和高性能,腾讯实施了一系列数据保护措施。”腾讯广告数据系统总监李锐表示,对于数据分析场景,腾讯基于Spark和Hbase构建了一套实时离线统一的统计系统,还自研了一套基于ssd的多维数据透视分析系统,对万亿行数据做实时查询仅需秒级。同时,借助于机器学习技术,特征工程重点保障特征数据的正确性,确保训练和预估使用的特征数据一致性,并且提升特征生产和调研的效率。此外,腾讯广告系统还涉及数据安全以及整个平台的架构问题等等。具体内容细节,将在数据库大会当天揭晓。
借助人工智能和大数据技术打造数字营销平台,精硕科技也积累了很多宝贵经验。精硕科技高级架构师刘喆,将分享人工智能在数字营销领域的一些实践,包括:平台构建、算法落地和具体的案例等。
然而,挖掘数据价值,让数据驱动商业变革,具体涉及哪些关键技术?根本没有标准答案可寻。字节跳动大数据技术专家郭俊,将带来《Spark Shuffle 稳定性与性能优化》主题演讲,具体介绍字节跳动提升 Shuffle 性能的技术变迁过程。众所周知,在 HDFS 与 Yarn 混合部署过程中,在长期几乎满负载的数万节点的大数据集群上,由于部分节点故障或者负载过高造成 Shufffle Read 时 SparkFetchException 的现象非常普遍。一旦发生问题,必然会触发 Stage 重试,从而延长整个 Application 的执行时间,增加了资源占用,同时影响了 SLA。因此避免 Shuffle 失败,提高 Shuffle 稳定性对保障 SLA 及提升资源利用效率具有重要意义。
当然,不管是大数据、人工智能,还是二者的结合体,只有适合自己、满足业务需要的技术,才能发挥实际价值。 58同城 AI Lab负责人詹坤林、华为高级技术专家时金魁、竞技世界首席数据科学家巴川等重量级嘉宾,将分别就智能客户、智能车联网、互联网游戏平台业务模型构建等话题,展开深入讨论。
总之,DTCC2019是一场真正意义上的数据库技术嘉年华,不管您是这一领域的创造者、架构者还是应用者,我们期待与您相聚,共同探索数据价值。DTCC 2019,我要参加,你要不要来?