050 翻译项目
050 翻译项目 (第2/3页)
上网查一下就知道了,模型精度达到你当前这个模型的等级就差不多了,材质的细节要求更高一些。”
“好吧!到时候我会安排的。时间上有要求吗?”
“时间倒是没什么要求,做好了发给我就可以了”
确定没什么事情之后,韩艺下线了。
不一会儿,翻译项目组的夏羽也被召唤到了虚拟办公场景中。当前夏羽使用的还是电子眼的虚拟形象,没有像韩艺那样去设计和替换自己的虚拟形象。
夏羽是个比较活跃的人,被召唤过来后不等九重问话,他就先开口了:“老大叫我过来什么事情”
“就是想了解一下翻译项目的进度。”
---
单从技术水平的角度来说,夏羽的编程技术是不足以担当项目带头人角色的,不过因为项目的特殊性,夏羽掌握的语言学识和程序员的身份,偏偏又与项目的契合度极高,所以九重还是让他带队翻译项目了。
并且翻译项目这边需要做的工作也比较另类,夏羽掌控全局是完全没有问题的。
翻译项目前期需要做的工作主要是数据的收集。
收集什么数据呢?自然是词库、翻译对照表这样的数据。
翻译的程序本质是什么?
简单!
翻译程序就是先获得用户的【提问】,然后由程序去【搜索】数据库,找到了对应的翻译对照内容,便可【回答】用户的提问了。
最重要的东西只有两个,一个是数据库,就是包含了很多个语种的翻译对照表。如果能搞来这个数据库,就算是最初级的程序员也能捣鼓出所谓的翻译软件。
二个是搜索算法,低级的算法当然是简单的查找并提取结果就行。但高级的搜索算法可就不这么简单了,单单是提高翻译精确度这一条就不知道要花费多少脑细胞才能设计出合理的算法。
所以九重对翻译项目的这样安排的,项目从头到尾要一直完善自己的【语料库】,包含各语种的词库,各语种翻译对照表等数据。越全面越好!等收集得差不多了再设计一套翻译算法管理语料库即可。
九重的翻译项目组之前做的就是数据收集的工作,不是人工录入那种笨蛋式的数据建立方式,而是通过编写一些特殊的小程序,由程序来提取网络中的语料库。
百度谷歌翻译自然而然的成为了重点照顾的目标,有现成的干嘛不用?自建多辛苦啊!
另外像是某某词霸,电子辞典之类的软件都成为翻译小组偷窃的目标。在九重从旁辅助的情况下,翻译项目小组的程序员们都快变成一个盗窃团伙了,到
(本章未完,请点击下一页继续阅读)