自然语言处理是人工智能皇冠上的明珠,而填补语言鸿沟的机器翻译则是自然语言处理最典型的应用技术之一。自20世纪90年代起,机器翻译迈入了基于统计建模的时代,发展到今天,深度学习等机器学习方法已经在机器翻译中得到了大量的应用,因此目前也是相当火爆。想必同学们也会经常在网上找一些好的学习资源。
最近,笔者在 github 上发现了一份机器翻译的教程,项目的 GitHub 地址为:
https://github.com/NiuTrans/MTBook
(文末附一键下载地址)
电子书截图1
电子书截图2
这套教程对机器翻译的统计建模和深度学习方法进行较为系统地介绍,不仅有相应的原理介绍和实现代码,还提供了实战案例,并通过图例对一些形式化定义和算法进行解释(共320张插图),对初学者来说,极为友好,可以学会建立自己的模型。
电子书截图3
值得一提的是,这份机器翻译教程还很贴心地提供slides,每个章节都有对应的课件,slides 共有 598页之多。整理好的slides,直接下载PDF就能使用,这人文关怀,无微不至。
slides 截图 1
slides 截图 2
slides 截图 3
就有网友评价道:算法、参数设置实验都比较细致,对小白友好,对专业领域的小伙伴很有帮助。
废话就不多说了,让我们一起来具体看看都有哪些内容吧:本教程共分为七个章节,章节的顺序参考了机器翻译技术发展的时间脉络,同时兼顾了机器翻译知识体系的内在逻辑。各章节的主要内容包括:
第一章:机器翻译简介
第二章:词法、语法及统计建模基础
第三章:基于词的机器翻译模型
第四章:基于短语和句法的机器翻译模型
第五章:人工神经网络和神经语言建模
第六章:神经机器翻译模型
第七章:神经机器翻译实战(参加一次比赛)
电子书截图 4
如果在学习中遇到相关问题,还可以点击下面的网址,加入讨论区答疑:
https://github.com/NiuTrans/MTBook/issues
这份名为《机器翻译:统计建模与深度学习方法》的教程是由肖桐、朱靖波老师编著,东北大学自然语言处理实验室· 小牛翻译联合出品的。作者表示,开源的本质是,通过对于源代码的免费共享使得无论软件还是硬件都可以通过社会化协作的方式,吸引更多志同道合者。这种“人人为我,我为人人”也是他们团队做开源项目所推崇的。撰写这份教程的目的,是让更多的人理解并学会机器翻译技术,并让这项技术帮助更多有需要的人。这套教程可以供计算机相关专业高年级本科生及研究生学习之用,也可以作为自然语言处理,特别是机器翻译领域相关研究人员的参考资料。
目前,所有源代码均已开放。上架不到一周的时间,在GitHub上的热度已经突破1000颗星星~这么好的资源,同学们赶快学起来吧!
一键下载电子书和PPT地址:https://www.yanxishe.com/resourceDetail/1692 雷锋网 雷锋网 雷锋网