Github近期最有趣的10款机器学习开源项目

-01-

Face Recognition

#世界上最简单的人脸识别库

本项目号称世界上最简单的人脸识别库,可使用 Python 和命令行进行调用。该库使用 dlib 顶尖的深度学习人脸识别技术构建,在户外脸部检测数据库基准(Labeled Faces in the Wild benchmark)上的准确率高达 99.38%。

项目链接:

https://github.com/ageitgey/face_recognition

-02-

MUSE

#多语言词向量 Python 库

由 Facebook 开源的多语言词向量 Python 库,提供了基于 fastText 实现的多语言词向量和大规模高质量的双语词典,包括无监督和有监督两种。其中有监督方法使用双语词典或相同的字符串,无监督的方法不使用任何并行数据。

无监督方法具体可参考 Word Translation without Parallel Data 这篇论文。

论文链接:

https://www.paperweekly.site/papers/1097

项目链接:

https://github.com/facebookresearch/MUSE

-03-

FoolNLTK

#中文处理工具包

本项目特点:

• 可能不是最快的开源中文分词,但很可能是最准的开源中文分词 

• 基于 BiLSTM 模型训练而成 

• 包含分词,词性标注,实体识别,都有比较高的准确率 

• 用户自定义词典

项目链接:

https://github.com/rockyzhengwu/FoolNLTK

-04-

Arnold

#最擅长玩《毁灭战士》的游戏AI

本项目来自卡耐基梅隆大学,是 2017 年 VizDoom《毁灭战士》AI 死亡竞赛冠军 Arnold 的 PyTorch 开源代码。

论文链接:

https://www.paperweekly.site/papers/1440

项目链接:

https://github.com/glample/Arnold

-05-

Bottom-Up Attention VQA

#2017 VQA Challenge 第一名

本项目是 2017 VQA Challenge 第一名团队两篇论文的 PyTorch 复现。

论文:Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering

链接:https://www.paperweekly.site/papers/754

论文:Tips and Tricks for Visual Question Answering: Learnings from the 2017 Challenge

链接:https://www.paperweekly.site/papers/1441

项目链接:

https://github.com/hengyuan-hu/bottom-up-attention-vqa


-06-


YOLOv2 - PyTorch

#PyTorch 版 YOLOv2

著名物体检测库 YOLOv2 的 PyTorch 版本,本项目还可以将训练好的 model 转换为适配 Caffe 2。

项目链接:

https://github.com/ruiminshen/yolo2-pytorch

-07-

Simple Railway Captcha Solver

#基于 CNN 的台铁订票验证码辨识

本项目利用简单的 Convolutional Neural Network 来实作辨识台铁订票网站的验证码,训练集的部分以模仿验证码样式的方式来产生、另外验证集的部分则自台铁订票网站撷取,再以手动方式标记约 1000 笔。 

目前验证集对于 6 码型态的验证码的单码辨识率达到 98.84%,整体辨识成功率达到 91.13%。

项目链接:

https://github.com/JasonLiTW/simple-railway-captcha-solver

-08-

AlphaZero-Gomoku

#用 AlphaZero 下五子棋

这是一个将 AlphaZero 算法应用在五子棋的实现,由于五子棋相比围棋或国际象棋简单得多,所以只需几个小时就可以训练出一个不错的 AI 模型。

论文:AlphaZero: Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm

链接:https://www.paperweekly.site/papers/1297

论文:AlphaGo Zero: Mastering the game of Go without human knowledge

链接:https://www.paperweekly.site/papers/942

项目链接:

https://github.com/junxiaosong/AlphaZero_Gomoku

-09-

gym-extensions

#OpenAI Gym 扩展集

这是一个 OpenAI Gym 库的扩展包,实现了包括:多任务学习、迁移学习、逆增强学习等功能。

项目链接:

https://github.com/Breakend/gym-extensions

-10-

Myia

#Python 深度学习框架

Myia 是一个全新的 Python 深度学习框架,具有使用简单、自动微分和性能优化的特点。


原文发布时间为:2018-01-02

本文来自云栖社区合作伙伴“数据派THU”,了解相关信息可以关注“数据派THU”微信公众号

上一篇:一起谈.NET技术,如何将ASP.NET MVC2项目升级到MVC 3 RC


下一篇:AlfaLaval公司采用低速通风技术冷却数据中心