疫情时期,用AI扛起中华文化输出的大旗

一、funstory.ai,扛起了中华文化输出的大旗

 

“霍青桐、陈家洛、乔峰、虚竹、朱珠、段誉、王语嫣……”说起武侠小说,Raphael能滔滔不绝讲两个小时。Raphael是赞比亚首都的一名外科医生,是金庸先生的忠实铁粉儿,因为他性格里颇有几分《雪山飞狐》里胡斐的义薄云天,所以在中国读书时朋友送给他一个和胡斐同音的名字——胡非。

 

“多亏了中国小说,帮我度过这辛苦的一年。”2020年的新冠肺炎疫情,也同样席卷了非洲大陆,让医疗资源本就紧张的赞比亚更加雪上加霜。Raphael从外科忙到内科,当起了“全科专家”。在这段忙碌压抑的日子里,中国的武侠小说成为了他的“心灵度假村。”这些小说都是英文的,很多都来自于 funstory.ai,这家公司翻译了各种各样的在中国网络市场上就饱受欢迎的网络作品。虽然在中国待了五年,Raphael还是觉得中文版的小说阅读起来很吃力,吭哧吭哧啃完一本小说,休闲的价值也打折了一半。“这个网站的翻译很准确也很有趣,我和我的朋友们都在这里阅读。”不知不觉,funstory.ai翻译的中国网络小说已经走出了亚洲、在非洲、欧洲、美洲多块大陆上拥有了忠实读者。疫情期间,中国小说让这批海外读者在隔离期间有了心灵慰藉,也让他们更加了解中国文化。

 

funstory.ai成立于2017年,是一家提供AI解决方案的网文出海开放平台,有全球首个文学领域人工智能AI翻译生产网络,为网文公司提供从零成本翻译到全球多语言分发变现的数字出版一条龙服务。

 

二、创业,自己相信的到底是什么

 

在采访中,CTO Gary回忆起2018年3月加入公司的情景——三个互相认识的朋友,合计起来一起搞事情。说起来当时网文出海AI翻译的创业方向选择,Gary依然印象十分深刻,“我们本身有一些翻译和技术上的积累,因此选择AI翻译的角度切入;其次是会去考虑我们相信的到底是什么?我们相信大家都会愿意去读一个好故事。所以我们现在的slogan 也是’AI 让好故事全球传播’。就整个行业的领先性来说,中国的网络其实整个生产模式是领先于全球其他地方的,所以这边可能会有大机会。行业领先,内容有优势,模式有优势,海外刚好这块是空缺,我们又有填补的这个解决能力。那为什么不做呢?

现在,通过技术的赋能,AI翻译系统能够自动监测、抓取、翻译、发布获得版权的中文小说,去除人工干预的机器算力可以达到3秒钟一章,1分钟20章,每天能达到2到3万章。根据测算,funstory.ai目前已是中国日更量最大的网文出海平台,日均更新近4000部小说。其AI生产分发系统可以15分钟/册的速度,单月出版发行3000多册小说,行业效率提高3600倍,成本降低到原来的1%。

在谈到公司发展过程中的关键时刻时,CTO Gary说,非常早期的时候,我们开放AI 翻译给C端用户,当时用户贴一个网址进来,然后就直接看到相应的英文版本的小说。但毕竟这么干其实是有版权风险的。于是一方面我们开始自己购买版权,然后做自主翻译,因为当时整个行业还没有开始批量化的做海外,所以当时我们用分成的形式拿了很多版权进来。另一方面,我们也通过第三方渠道分发的电子书带来的销售收入,证明了商业上的可行性,这也是我们的第一笔来自客户的收入。就是这样的两个节点其实是帮助我们串起了上游和下游的业务通路,也让我们有机会在整个生态链上做的越来越好,因此我们现在也开始做行业整体的解决方案,希望能进一步地为行业赋能。

 

三、 稳定、高效的基础设施,让机器“说人话”


不同于财经、科技、医疗、法律这些文本品类非常规范的翻译,网文具有很多奇特的用语,机器直译往往会贻笑大方,比如“神雕侠侣”,机器翻译一般为“Eagle Warrior”,但是读者更加熟悉的是“The Condor Heroes“。推文科技会从最初的技术上做动作:在整个生产过程的时候会批量的去做数据,之后经过中文侧改写引擎的修改把关,在这个基础上再看中英翻译,最后整个流程里面可能会有一些需要人工介入进一步优化的部分。从批量翻译的结果来看,基于AI最理想的其实是一个质量的稳定性,Gary非常坚定,“我们可以非常稳定的出品一个比较高质量的文本。”目前的推文科技,除了直接面向百万规模的海外读者,还开发了面向行业的整体解决方案,一方面将批量的翻译完成的版权文本交给第三方做分发,另一方面积累的翻译能力也可以去服务于其他的出海平台,通过高效率低成本的翻译工作为整个行业降本增效。

而这些技术手段,都需要建立在稳定、高效的基础设施之上。

作为一家科技公司,推文科技有着深厚的技术基因。在公司刚刚成立不久,推文科技就搭建了自己的机房,相当于裸的ECS 自己搭K8S系统,而在做出海业务的时候,面向于海外市场,当时推文科技的第一选择是海外公共云服务商,但是随着业务规模的扩大,慢慢的出现了一些问题,“当时最主要的问题其实是在监控和反馈上,因为我们的整个集群 CPU 当时被打满了,而监控上其实很隐晦,然后很难看出来。但是服务商提供的服务不是很友好,需要找客服协助排查,但是因为系统的熟悉度不够,找客服协助还需要额外支付价格不菲的客户服务费用。于是经过权衡之后,还是切回到了相对熟悉得多的阿里云上。因为阿里云那个时候也正好上线了海外可用区,就直接就用了。”

目前funstory.ai的存储布局在阿里云的对象存储OSS 上,解决了推文科技存储大量图片的硬需求,除了此项之外,在存储整体解决方案中,给推文科技留下印象最深的,还属于阿里云的日志服务SLS。推文亟需解决的便是7*24小时实时监控业务系统运行状况,时刻保障系统运行的难题,况且容器存活时间也较短,业务日志稍纵即逝,很多日志没有保存下来容器便消失,故障难以排查。日志服务系统便可提供完整的K8s采集方案,简单配置即可应用,这对推文科技而言,一拍即合。从系统的复杂性来讲,推文科技还会集成Flink,FC,WAF等应用,这些也需要运维,所产生的日志统统都可由日志服务SLS接入,统一管理。在人员不足的情况下,日志服务SLS的自动监测,运维运营报表,起到了关键作用,辅助推文科技进一步定位问题,解放时间提高效益。目前,推文科技正在推进日志服务SLS集成到飞书,实现告警的兼容。在整个云上解决方案中,如果把ECS当作武侠故事中的一角,强大的内核算力,它便像是风清扬,独步武林,而日志服务SLS更像一个隐型的运维管家,像一个扫地僧,维护整个武林的典籍,不被任何人窃取,不出事便不出手,一出手就能平息祸端。

 

四、传播中国声音,讲好中国故事

 

20世纪80年代以来,伴随着全球化的发展,好莱坞大片、韩流影视、日本动漫、宝莱坞歌舞剧……各种各样的文化浪潮涌入中国市场,而中国文化反而成为西方跨文化输出中成为东方主义视角下的文化奇观。学界与社会多次呼喊中华文化跨文化传播的主体意识。

近年来,随着一批影视与文学作品的走出去,中国文化在全球有了更多的话语空间。在推文科技,我们看到通过AI赋能,云计算技术革新带动整体产业降本增效焕发新的活力;产业出海,寰宇之下近百亿的空间体量有更大的市场等待挖掘。传播中国声音,讲好中国故事,今天我们看到前沿科技、传统产业、战略方向相互交织,产业成就技术,技术赋能产业,这是一条确定性的赛道,也是一条有着无限潜力的赛道。

上一篇:嵌入式Linux之我行——u-boot-2009.08在2440上的移植详解(二)


下一篇:【干货】银联智策:大数据驱动的个性化财富管理