胡说八道 - 知乎杂谈

hugging face 是怎么起家的?

  • 开源创业公司
  • 最初是做机器人聊天服务的
  • 当初复现并开源了 google bert 的 tensorflow 版本,而声名鹊起。
  • 现在有开源的 nlp 社群,提供很多 pretrained language model。
  • 只需要安装 transformers 包,指定模型的地址,就可以用他们的模型。

 

还有啥创业公司

  • AI INFRA
    • 弱监督标注系统:snorkel ?
      • https://zhuanlan.zhihu.com/p/72531604
      • 感觉很适用于金融系统?因为标签少。可能有相悖的样本?
      • 也适用于 nlp 这种人为标注,比较主观的多人标签上?
      • 可以快速生成训练数据的弱监督系统。
      • 在 tweet 情感分析的任务中,适用snorkel 的标签,比直接平均效果要好。
上一篇:docker 部署隔离其他环境


下一篇:NLP 开源形近字算法补完计划(完结篇)