机器翻译蓝灯鱼:tf2.0基于注意力的神经机器翻译训练发布过程

木头鱼在线翻译  时间:2021-04-26  阅读:()

文档

蓝灯鱼 Tf2.0+基于注意力的神经机器翻译训练发布过程本篇是人工智能、机器翻译的干货文章面向从事人工智能的研发工程师和翻译领域的职业从业者。意在译员能更好的从计算机编程角度理解机器翻译的代码实现过程。同时也和机器翻译开发工程师共同分享源码的快乐。

实例是采用当下最新的tensorflow2.0+框架实现transforme r模型Attention注意力、MultiHeadAttention 多头注意力 、位置嵌入、掩码、按层提取翻译结果、 Flask服务发布。实例代码为完整代码拷贝即可运行如果有兴趣获得完整的.py代码请在公众号下留言获得代码文件。

本文章主要是tensorflow2.0官方教程的模拟整理而来喜欢原版和英文阅读的请参考官方教程。官方为葡萄牙语和英语的翻译只有训练和预测过程。未给出中文实例、也丌能发布应用。

实例用1000W数据训练后的结果参考

文档

文档

整个过程可以分一下几个步骤

1. 创建机器翻译模型训练数据。

2. 模型编写和超参数设置。

3. 训练模型。

4. 发布模型应用服务

5. 验证机器翻译模型结果

公共参数HyperParams.py

文档

1.创建机器翻译模型训练数据。生成源语言和目标语言的词典

文档

注意如果数据量过大会内存溢出。本人用1000W数据发生此情况另外利用jieba分词重新生成了subword的中文的词典。

2.模型编写和超参数设置。 transformer_model.py

文档

文档

文档

文档

Hosteons - 限时洛杉矶/达拉斯/纽约 免费升级至10G带宽 低至年$21

Hosteons,一家海外主机商成立于2018年,在之前还没有介绍和接触这个主机商,今天是有在LEB上看到有官方发送的活动主要是针对LEB的用户提供的洛杉矶、达拉斯和纽约三个机房的方案,最低年付21美元,其特点主要在于可以从1G带宽升级至10G,而且是免费的,是不是很吸引人?本来这次活动是仅仅在LEB留言提交账单ID才可以,这个感觉有点麻烦。不过看到老龚同学有拿到识别优惠码,于是就一并来分享给有需...

快快云:香港沙田CN2/美国Cera大宽带/日本CN2,三网直连CN2 GIA云服务器和独立服务器

快快云怎么样?快快云是一家成立于2021年的主机服务商,致力于为用户提供高性价比稳定快速的主机托管服务,快快云目前提供有香港云服务器、美国云服务器、日本云服务器、香港独立服务器、美国独立服务器,日本独立服务器。快快云专注为个人开发者用户,中小型,大型企业用户提供一站式核心网络云端服务部署,促使用户云端部署化简为零,轻松快捷运用云计算!多年云计算领域服务经验,遍布亚太地区的海量节点为业务推进提供强大...

舍利云30元/月起;美国CERA云服务器,原生ip,低至28元/月起

目前舍利云服务器的主要特色是适合seo和建站,性价比方面非常不错,舍利云的产品以BGP线路速度优质稳定而著称,对于产品的线路和带宽有着极其严格的讲究,这主要表现在其对母鸡的超售有严格的管控,与此同时舍利云也尽心尽力为用户提供完美服务。目前,香港cn2云服务器,5M/10M带宽,价格低至30元/月,可试用1天;;美国cera云服务器,原生ip,低至28元/月起。一、香港CN2云服务器香港CN2精品线...

木头鱼在线翻译为你推荐
定向fastreport2enter苹果5支持ipadxp如何关闭445端口请大家帮帮忙,怎样关闭135和445端口?netbios端口netbios ssn是什么意思?ipad如何上网ipad如何允许app使用网络win7telnet怎样在win7下打开telnet 命令iphonewifi为什么我的苹果手机连不上wifiwww.baidu.jp日本视频怎样看android5.1安卓5.0和安卓5.1的区别在哪里?
虚拟主机提供商 香港vps 如何注销域名备案 免费cn域名 securitycenter bluehost 鲨鱼机 mediafire下载工具 表格样式 360抢票助手 万网优惠券 空间服务商 免费ftp站点 蜗牛魔方 中国电信测速112 美国堪萨斯 yundun 万网空间管理 帽子云排名 电信宽带测速软件 更多