歡迎您訪(fǎng)問(wèn)志遠翻譯官方網(wǎng)站!
專(zhuān)注翻譯20+年
  • 在線(xiàn)咨詢(xún)
  • 400-811-9518
  • 在線(xiàn)詢(xún)價(jià)
  • info@ata.com.cn
?

挪開(kāi)大數據,大內容就在這里

Date: 2019-06-29 19:34:55Source: 志遠翻譯

在過(guò)去十年的大部分時(shí)間里,大數據是一種技術(shù)現象,而不是其他任何一種技術(shù)現象,企業(yè)試圖利用這種技術(shù)為自己謀利。人們在網(wǎng)絡(luò )生活中每天采取的成千上萬(wàn)的行動(dòng)可以被用來(lái)定位廣告,識別趨勢,甚至預測行為,這是一個(gè)誘人的想法。市場(chǎng)營(yíng)銷(xiāo)部門(mén)和整個(gè)公司都以數據作為“21 世紀的石油”為前提。

這些公司挖掘了我們的搜索歷史,我們的瀏覽行為和我們的上網(wǎng)習慣,其中一些公司通過(guò)銷(xiāo)售或使用它來(lái)瞄準他們的市場(chǎng)獲得了巨大的利潤。

現在又出現了一種新的現象。最近的數據濫用丑聞使大數據運動(dòng)黯然失色,將行業(yè)重點(diǎn)轉移到了一個(gè)更可持續的模式上:走進(jìn)這些宏大的內容里。

想想互聯(lián)網(wǎng)有多大。它真的很大。有 550 億個(gè)網(wǎng)頁(yè)。如果每一頁(yè)都有 100字,那就是 5.5 萬(wàn)億字。這可能是一個(gè)保守的估計。顯然,并非所有這些內容對擁有這些內容的公司都有用。這些頁(yè)面中有許多包含填充語(yǔ)、文本或法律術(shù)語(yǔ)。從大內容的角度來(lái)看,真正讓營(yíng)銷(xiāo)人員感興趣的頁(yè)面是那些可以被收獲并對數據分析人員有用的頁(yè)面。那么,什么是“大內容”?讓我們把電子商務(wù)的產(chǎn)品描述和評論作為最好的例子在這里,有數以百萬(wàn)計的產(chǎn)品在互聯(lián)網(wǎng)上銷(xiāo)售,他們每一個(gè)都需要一個(gè)良好的書(shū)面描述,以有效地銷(xiāo)售。同樣,這些產(chǎn)品中的絕大多數都在站點(diǎn)上提供了一個(gè)或多個(gè)客戶(hù)評論。如果他們是信息和明確,他們可以幫助買(mǎi)家作出自己的決定,也可以幫助零售商采取任何反饋在船上。所有這些都是與特定產(chǎn)品相關(guān)的內容。

挪開(kāi)大數據,大內容就在這里

因此,有許多有用的內容,但你如何處理這些信息,現在它是現成的?現在我們知道所有這些信息都存在,我們確定為一個(gè) 語(yǔ)言服務(wù)提供商,它很可能在某一點(diǎn)上需要多種語(yǔ)言,要在多個(gè)國家/地區銷(xiāo)售產(chǎn)品,就需要本地化。然而,所涉及的龐大字數排除了傳統的每天 2000 字的翻譯方法,因為這太費時(shí)了。

這就是機器翻譯譯后編輯 (MTPE) 和眾包的用武之地。有效處理如此大量?jì)热莸囊环N行之有效的方法是大規模機器翻譯,并使用大量經(jīng)過(guò)審查的語(yǔ)言學(xué)家對其進(jìn)行后期編輯并優(yōu)化其對讀者的影響。在工業(yè)中,使用 NMT 正迅速成為一種普遍現象。然而,仍然有陷阱與機器轉換和準確性仍然是問(wèn)題。這就是我們引入人的元素以確保質(zhì)量的地方。但是,由于“大內容”項目中的字數太多,采用眾包策略是加快這一過(guò)程的一種快速而有效的方法。通過(guò)吸引多種語(yǔ)言,并為他們提供成為成功的后編輯所需的培訓和知識,我們可以產(chǎn)生更快的、有質(zhì)量保證的結果。

這就是為什么眾包仍然是 Joncker 和整個(gè)行業(yè)的一個(gè)重要焦點(diǎn),在大內容時(shí)代,這種方法顯然是唯一可持續的解決方案之一。


The End

在線(xiàn)詢(xún)價(jià)

Get Quote

聯(lián)系客服人員或致電175-1160-1970告訴我們您的需求, 我們會(huì )在第一時(shí)間與您聯(lián)系。

服務(wù)項目
姓名
稱(chēng)謂
Email
聯(lián)系電話(huà)
源語(yǔ)言
目標語(yǔ)言
交付時(shí)間
留言
国产高清色高清在线观看九_亚洲欧美丝袜精品久久中文字幕_中文版免费三级片播放_人人爽人人香蕉