Github 最新 AI 开源项目了解一下?
这是 PaperDaily 的第 48篇文章
DeepPavlov
#对话系统训练开源库
DeepPavlov 是一个基于 TensorFlow 和 Keras 的智能对话库,其主要用途在于推动 NLP 和对话系统的研究,提升复杂对话系统的实现和评价效果。
DeepPavlov 可为研究者提供:
- 用于实现和测试对话模型的框架
- 一系列预训练的 NLP 模型、预定义的对话系统组件(机器学习/深度学习/规则系统)和流程模板
- 对话模型的基准测试环境和对相关数据集的统一访问
DeepPavlov 可为 AI 应用开发者提供:
- 用于构建对话应用软件的框架
- 将应用与相关基础工具(即时通讯、服务支持软件等)加以集成的工具包
项目链接
https://github.com/deepmipt/DeepPavlov
#深度学习框架随心切换
MMdnn 由微软开源,可将不同框架训练的深度神经网络模型进行转换,使之适配其他框架。该工具包目前已支持 Caffe、Keras、MXNet、Tensorflow、CNTK、PyTorch 和 CoreML。
MMdnn 具有如下特点:
- 模型文件转换,转换深度神经网络模型使之适配各种不同框架
- 模型代码片段生成,生成适合不同框架的训练或推断代码块
- 模型可视化,针对不同框架可视化深度神经网络模型网络架构和参数
项目链接
https://github.com/Microsoft/MMdnn
Age and Gender Estimation
#用CNN测算性别和年龄
本项目是一个基于 Keras 框架实现的 CNN 模型,用于根据人脸照片测算年龄和性别。
项目链接
https://github.com/yu4u/age-gender-estimation
Couplet
#用深度学习对对联
Couplet 是一个基于 Seq2Seq 的对联生成工具,本项目基于 TensorFlow。
Demo: https://ai.binwang.me/couplet/
项目链接
https://github.com/wb14123/seq2seq-couplet
Landing a SpaceX Falcon Heavy Rocket
#用强化学习控制火箭着陆
本项目是 Siraj Raval 在 YouTube 上发布的强化学习教学视频对应代码,如何在 Gym 模拟器里用强化学习控制 SpaceX 猎鹰重型火箭着陆。
视频链接
https://youtu.be/09OMoGqHexQ
项目链接
https://github.com/llSourcell/Landing-a-SpaceX-Falcon-Heavy-Rocket
Caffe for CC4.0-Windows
#简单方便的Caffe C++接口
CC4.0 是一个可用于 Windows 系统的 Caffe 库,简单的 Caffe C++ 接口,方便简单而更深入地研究深度学习。
项目特性如下:
- 只需要一个头文件和一个依赖项 libcaffe.lib
- 能够轻易使用 C++ 写训练过程或调用过程
- 能够轻易自定义 layer,不用编译 Caffe 也不用修改 caffe.proto,只修改代码即可使用。自己实现数据层,不需要 lmdb 也能高效率训练
- 能够在训练过程中对自定义 layer 进行调试查看中间结果
- 支持 LSTM 不定长 OCR(有案例),支持 SSD 更轻易地进行训练
- 有了 4.0 的支持,能够轻易实现任何新的网络结构
- 允许通过自定义层在训练中查看训练效果,更易于理解 CNN 的学习效果
项目链接
https://github.com/dlunion/CC4.0
SLTK - Sequence Labeling Toolkit
#序列化标注工具
SLTK 是一个序列化标注工具,实现了 Bi-LSTM-CRF 模型,并利用 PyTorch 实现了高效的数据加载模块,可以完成:
- 预处理:包括构建词表、label 表,从预训练文件构建 word embedding
- 训练:训练序列化标注模型,并保存在开发集上性能最好的一次模型
- 测试:对新的实例进行标注
项目链接
https://github.com/liu-nlper/SLTK
OD Annotation
#目标检测数据集标注工具
本项目是一个目标检测数据集标注工具,采用 Python-flask 框架开发,基于 B/S 方式交互,支持多人同时标注。
项目特点如下:
- B/S 方式交互
- 支持多人同时标注(可分配不同标注人员的标注范围,或不同人员标注不同类别)
- 类别采用选择方式,免去手工输入类别工作
- 支持拖拽方式修正标注区域
- 支持键盘方向键切换标注样本
项目链接
https://github.com/hzylmf/od-annotation
TopiCluster
#多文档主题聚类
TopiCluster 是一个基于 Kmeans 与 Lda 模型的多文档主题聚类。输入多篇文档,输出每个主题的关键词与相应文本,可用于主题发现与热点分析。
项目链接
https://github.com/liuhuanyong/TopiCluster