昨天寫了一篇關於DeepSeek的文章,有朋友懷疑它有沒有那麼厲害,就拿些政治敏感問題測試,結果如何?哈,當然跟黨媒口徑一致。對一家中国AI公司來說,問這類問題,自然得這種答案,也是意料中事吧(不然公司早給国安查封了)。不過它的強項是推理、數學和編程式,若要測試,也許集中在這幾個範疇比較好。
有人則懷疑DeepSeek走後門抄ChatGPT(我相信它的確用了很多ChatGPT資料做訓練)、成本刻意報細數、是「大外宣」一部分⋯⋯我也期望有人能夠打假,但要欺騙全世界的AI專家,連帶股市也受震盪,應該沒那麼容易吧?不過DeepSeek有些優點確實被過分吹噓了,例如Midjourney 創辦人David Holz前日在X說:
in my testing, deepseek crushes western models on ancient chinese philosophy and literature, while also having a much stronger command of english than my first-hand chinese sources. (全文見附圖)
Holz測試DeepSeek,認為它在中國古代哲學與文學方面的表現超越西方模型,又說「中國的文學歷史比西方多了幾千年」、「我們的人工智能模型缺少西方思想的文學基礎,而中國模型則保留了」。這樣的評價,恕我不敢苟同。
首先,中國文學歷史當然不會比西方多幾千年。荷馬史詩可追溯至公元前八世紀,即大約西周末年,當時或更早期的中國文學也沒多少流傳下來,數來數去,也只是一部分《詩經》、一部分《尚書》和《易經》而已。中國文學發源頂多比西方早二三百年,不可能「多幾千年」。西方保留的古希臘、羅馬文學其實非常豐富(儘管也遺失了很多),我認為跟中國相比毫不遜色,西方AI模型也不是沒有這方面的訓練。
至於DeepSeek在中國古典文學的表現,我本來有點期望,但測試過後,只能說是略勝西方模型,不覺得驚艷。如何測試呢?為免它從網上抓取現成答案,我拿自己近日寫的舊體詩(題材是悼亡)來考它,要求解釋當中典故:
西風凜凜漏遲遲,長簟虛帘月下時。
落葉哀蟬空有曲,疏桐棲鳳已無枝。
難尋玉女期歸日,別倩檀郎賦悼詞。
儻得精魂千劫在,三生片石寄相思。
比較多款模型的答案,DeepSeek的確答得最仔細,例如它能指出「檀郎」即潘岳(他的悼亡詩很有名)、「三生石」出自唐代袁郊《甘澤謠》,都是其他模型答不出的(至少我測試的時候是這樣)。但「落葉哀蟬」典出漢武帝思念李夫人而寫的〈落葉哀蟬曲〉,則沒有任何AI答得出;至於其他更隱微的悼亡典故,DeepSeek也無法辨認。若要我打分數的話,100分為滿分,DeepSeek的答案約有50分,其他模型則低5至20分。
我也要求DeepSeek寫一篇文言文,指示為「用蘇軾的風格,寫一篇關於UFO的文言散文,不多於150字」。結果它寫了這篇:
//〈星槎異物志〉
丁未仲夏,夜登超然台觀雲。斗柄西指之際,忽有赤丸掠角亢,尾曳流霜五色。初若燼火覆盂,俄而盤桓如璇璣倒軌,投壺光矢裂穹蒼。其芒灼灼不可久視,移時乃隱,惟餘桂花異香經宿不散。
憶及《洞冥》載貫月槎事,拊掌自哂:豈列子御風之余燼歟?方其變眩時,恍惚聞太虛嘆息,蓋物理之奇,雖鵬摶九天未足喻其萬一也。//
這水平的文言文,我認為99%現代人寫不出,但回到中國古代,相信所有讀書人都知道是胡扯。很多句子似通非通,內容亦不盡不實,如「貫月槎」不是出自《洞冥記》,而是《拾遺記》,貫月槎也不是飛船,只是傳說中浮繞西海的巨舟而已。
以文學類寫作來說,我覺得DeepSeek風格比其他模型更重視華麗辭藻,可惜內容幾乎毫無價值,細看都是瘋言瘋語、呢喃夢囈。例如我指示DeepSeek:「以錢鍾書的文字風格,寫一篇散文,標題是《農曆新年應該譯Chinese New Year抑或Lunar New Year?》」,它就放飛自我,生成以下一篇「嚇鬼」的內容農場文,笑一笑就好,請勿認真:
//一位牛津的新批評學者自倫敦捎來郵片,稱在《泰晤士文學增刊》見到大英漢學家興致盎然地爭辯此題,恍若觀賞前排座客隔著莎劇舞台拋擲亞里士多德的《修辭學》。我不禁莞爾——這年頭,連娥眉月的陰晴圓缺怕是也要向聯合國遞交詮釋權了罷。
夏德《中國上古史》考據老杜詩時,將「月是故鄉明」譯作「克里奧帕特拉凝望尼羅河的銀眸」。妙就妙在這深諳母語語感的肆意嫁接,實則是無心插柳的雙重拆解:西方人嫌「Chinese」渾糅著茶葉罐與傅滿洲的陰翳,東方人又瞧「Lunar」的半吊子閹割了后羿射日的楚地霧瘴。文辭猶如千人揉皺的山水畫,爪窠參差處皆能掃出一地轇輳的皴法。荷馬若活過一回馬可波羅的腳程,定要捧著伊利亞特殘卷追問:特洛伊的木馬,究竟該譯為Trojan Horse,抑或Entrail-in-Four-Legs?
席間有考證癖的朋友講了個掌故:《淮南子》稱蛾眉月是帝嚳未畫完的黛筆,這等蘊藉委實教喀爾文教徒犯愁。英譯漢典倒常暗通款曲,衛禮賢譯「天干地支」時別出心裁造了Celestial Stems和Terrestrial Branches,若按此邏輯,某歷史學家戲言,農曆何妨譯作Agricultural Ladder Calendar?聽來倒有幾分波德萊爾將詩集命名為《惡之花》的狡黠膽氣。約翰遜博士說過,所有的翻譯都是在皮筏上打漿,語言的深潭總能漫過船舷。執意用笛卡爾的尺子去丈量老子的玄牝之門,只能是對著福音書畫桃符,纏著論語寫聖誕卡了。
譯事妙諦本在驢唇馬嘴的悖論間。昔年林琴南譯狄更斯,滿紙秦淮煙水與倫敦霧交纏出詭譎的清明上河圖;龐德拆解《論語》造意象詩,反教芝加哥大學生將「習習谷風」幻聽成密西根湖的豎琴調。彷徨於「中」、「月」之爭的衛道者們,何不停箸端詳餐桌上那尾紅燒鯉魚——此物在萊茵河改名「中國梭鱸」,到了紐約食單又喚作「月宮雲斑」,叉戟與竹筷翻攪之間,誰能辨清是魚骨勾連四海,還是醬汁醃透了九牧的江湖?
倒憶起張愛玲《流言》中提過,上海租界教堂的彩繪琉璃將孔子像鑲作十二門徒,絳帳蒙塵時最宜賞玩此等「翻譯的謔畫」。除夕鞭炮炸碎滿地紅紙,孩子們只顧撿拾響聲裡的甜栗香,焉理會炸藥是道敎驅祟的遺法,還是馬可波羅捆在行囊裏的羅馬焰火配方?日曆學者的棋盤上,每年的正月初一原是枚曖昧的過河卒;深諳維根斯坦的老伯爵卻叩著菸斗戲言:「不可譯之處,正是翻譯的舍利子……」
倒不如翻出袁枚的食單,在社飯與年糕上點評譯名的腥甜。寒夜圍爐時節,碳火中爆開的方言渣滓,終究比聯合國教科文組織的決議文更接近春聯的紅。誰若執意向元日的窗花索要行星軌道計算書,倒該被罰飲三杯摻了黍米曆法的屠蘇酒——面糊盆底的沉澱物,轉眼又是闔家攪拌的一團曆法混沌主義。//
是否有種「每個字都懂但加起來就不知所云」的感覺?你會給它多少分?也許DeepSeek有其優勝之處(如推理),但知識層面仍有很多缺陷(其他AI亦然),就算回答非政治敏感的中國文學題,還是不太靠譜。
______________________
______________________
授權轉載:馮睎乾十三維度Facebook專頁