Mike Petrucci 发布在 Unsplash 杂志上的照片
在这篇文章中,我们将看到 2019 年在 MyBridge 上最受欢迎的顶级开源机器学习项目。
实时语音克隆(13.7K⭐️)
这个项目是 SV2TTS 论文的一个实现,它是一个能够实时工作的声码器。使用此 repo,用户可以在 5 秒内克隆语音,实时生成任意谈话。
网址:https://arxiv.org/abs/1806.04558
SV2TTS 的三阶段深度学习框架允许从几秒钟的音频中创建语音的数字表示。
网址:https://github.com/CorentinJ/Real-Time-Voice-Cloning
UGATIT:具有自适应层实例规范化的无监督生成注意网络(4.4K⭐️)
这是 U-GAT-IT 的 TensorFlow 实现。本文提出了一种无监督图像到图像转换的实现方法,该方法增加了一个新的注意模块和一个新的可学习的端到端的归一化函数。
网址:https://arxiv.org/abs/1907.10830
注意力模块引导模型关注更重要的区域,从而基于辅助分类器获得的注意力图来区分源域和目标域。AdaLIN(自适应层实例归一化)函数帮助模型通过学习的参数控制图像中形状和纹理的变化量。
网址:https://github.com/taki0112/UGATIT
RAdam:自适应学习速率的方差及其超越(1.9K⭐️)
这是以下论文的一个实现:
网址:https://arxiv.org/abs/1908.03265
作者提出了 Adam 的变体 RAdam。这是通过校正自适应学习过程的方差来实现的。作者使用图像分类、语言建模和神经机器翻译任务来获得实验结果。
网址:https://github.com/LiyuanLucasLiu/RAdam
深度学习推荐模型 Dlrm 的实现(1.7K⭐️)
这是一个最先进的深度学习推荐模型——DLRM,它可以在 PyTorch 和 Caffe2 中实现。
网址:https://arxiv.org/abs/1906.00091
该模型有一个专门的并行化方案,该方案利用嵌入表上的模型并行性来迁移内存约束。这使得数据并行性的开发能够从完全连接的层扩展计算。
网址:https://github.com/facebookresearch/dlrm
TecoGAN(1.3K⭐️)
此 repo 包含用于 TEmporally COherent GAN 的代码。
网址:https://github.com/thunil/TecoGAN
视频网址:https://youtu.be/pZXFXtfd-Ak
这篇论文提出了一种对抗性训练视频超分辨率方案,该方案在不牺牲空间细节的前提下,实现了时间相干解。它还提出了一种 Ping-Pong 损失,可以在不降低感知质量的情况下消除递归网络中的时间伪影。
网址:https://arxiv.org/abs/1811.09393
Megatron-LM(1.1K⭐️)
Megatron repo 是一个正在进行的研究项目,旨在大规模训练大型、功能强大的 transformer 语言模型。它目前支持 GPT2 和 BERT 的模型并行、多节点训练。
网址:https://github.com/NVIDIA/Megatron-LM
它目前能够训练具有 72 个层,83 亿个参数的 GPT2 语言模型,具有 8 路模型和 64 路数据并行性,它们分布在 512 个 GPU 上。它可以在 3 天内训练多达 64 V100 gpu 的 BERT。Megatron 语言模型的困惑度为 3.15,F1 评分为 90.7。
TensorNetwork(1K⭐️)
TensorNetwork 是一个用于实现 tensor 网络算法的开源库。它是 TensorFlow、JAX、PyTorch 和 NumPy 的 tensor 网络包装器。
网址:https://github.com/google/tensornetwork
张量网络是目前应用于机器学习研究的稀疏数据结构。目前,开发人员并不提倡在生产环境中使用该工具。
网址:https://arxiv.org/abs/1906.06329
Python_autocomplete(708⭐65039;)
这是一个基于 TensorFlow 项目,它的目的是测试 LSTM 自动完成 Python 代码的能力。
网址:https://github.com/vpj/python_autocomplete
Buffalo (365 ⭐️)
Buffalo 是一个快速、可扩展、面向实际生产的推荐系统开源项目。它有效地利用了系统资源,从而在低规格的机器上实现了高性能。
网址:https://github.com/kakao/buffalo
真实的神经说话头部模型(312⭐️)
这是「Few-Shot Adversarial Learning of Realistic Neural Talking Head Models」一文的实现。这篇论文提出了一种个性化的、逼真的说话头部模型,其目的是在给定一组人脸标志的情况下合成具有真实感的个性化面部图像。
网址:https://arxiv.org/abs/1905.08233
这个方法适用于远程呈现、视频会议、特效行业和多人游戏,它所提出的系统能够以特定的方式初始化生成器和判别器的参数,这使得训练过程中图像能被快速地使用。
网址:https://github.com/vincent-thevenin/Realistic-Neural-Talking-Head-Models
展望未来
展望 2020 年,随着机器学习工具变得更先进、更具易用性,我们肯定会遇到更多有趣的开源项目,敬请期待。
via:https://heartbeat.fritz.ai/2019s-top-open-source-machine-learning-projects-3cd082a02f78
雷锋网雷锋网雷锋网(公众号:雷锋网)
雷锋网版权文章,未经授权禁止转载。详情见。
原创文章,作者:ItWorker,如若转载,请注明出处:https://blog.ytso.com/137588.html