說有心得還真的是很有心得
我連為什麼希羅二設被當成氣味控
都有一套神奇的理論證明
這篇主要會提到的應該是ヒロエマ和シェリハン
主要看比較多的部分
ヒロエマ的同人文真的多到很誇張
中文圈比較多人翻譯的應該也是ヒロエマ
反而還沒看過太多人翻譯シェリハン的
ヒロエマ在最後給人的遐想真的太多了www
有時候反而覺得シェリハン要寫得好反而不容易
太難發揮了
九萬字诶,你讓我大學讀九年我都寫不了這麼多字
但我覺得他厲害的不是他的鬼神長文,也不是車的部分
肯定也不是我吐槽的部分
厲害的是怎麼在這樣的篇幅裡面
去詮釋原作ヒロエマ的情感流動
然後盡可能地貼近原作
根本是拿商業百合小說去出續作的感覺
然後我有看一下作者之前寫過什麼
蔚藍檔案百合,學園偶像百合,賽馬娘
而且看起來他的習慣就是寫長文
總之,Pixiv這邊還有很多很有趣的百合二創
有待大家「尋寶」了
那如果你說除了pixiv
還有什麼平台能看
我會說應該是Lofter
我猜他應該是台灣人
除了看IP,還有他回覆的時候是用繁體字
(lofter的回覆很奇怪,不能把文字複製貼上,只能用打的)
會特別把lofter拿出來講是因為
大概看過他的文就知道為什麼他的流量很好
厲害到有點恐怖的程度
我覺得fish很厲害的一點是
他把私設跟原作要素處理得很好
你明明知道他是私設
但是仔細一看全是原作要素的呼應
還呼應的恰到好處(對用恰到好處形容)

這是褒義
而且有時候還會看到時下百合圈最流行的梗
所以有時候除了看他的文章
看底下留言區的大喜利環節有時候還比較好玩
所謂的場外比場內精彩
什麼五個字填空,阿這個九頭蛇萬歲
還是什麼天降青梅過於震撼
有興趣我再補充這個故事,把我氣笑了
fish基本上都寫ヒロエマ,也有一篇是シェリハン
有甜的也有刀的
個人特別喜歡天降青梅這一部份但天降不是名詞
不過fish最近有說沒有很想再寫
很多同人作家最近不想創作很可惜但也能理解
我們下一部影片會聊為什麼Acacia會這樣經營
為什麼他們會作出這種把一票玩家嚇跑的操作
這又是題外話了
好那你說這些都看完了
還有什麼能看的
或是你說在看日文這一方面
會覺得比較吃力
套句常說的,我們有最新科技
現在的語言模型在翻譯這一塊應該算滿優秀了
我覺得重點只剩下prompt要怎麼下比較好
所以基本上看你是要用GPT或是Gemini都行
我還沒對這部分作evaluation(評估)
這個後面會再講
可以分享一下這一部份我是怎麼做的
畢竟算是半個專業(?
大金(我的指導教授)知道我在這裡整爛活應該會氣瘋
這部分作簡單的ICL(in-cnotext learning)就好,還不用到fine-tuning這麼麻煩
我先對整個遊戲的設定做了整理
讓語言模型輔助作了一個json檔案
大概是像這樣
"name_jp": "桜羽エマ",
"name_zh": "櫻羽艾瑪",
"pronouns": {
"source": "ボク (Boku)",
"target_zh": "我 (語氣需帶有少年感/中性)"
},
"translation_guide": {
"tone": "活潑、親切、有些笨拙。句尾常帶有「だよ (dayo)」、「ね (ne)」。",
"suggestion": "翻譯時多用「喔」、「呢」、「吧」等語助詞,展現元氣但帶點不安的感覺。自稱不需特別翻成「僕」,用一般的「我」即可,但語氣要直率。對他人稱呼會在名字後加上醬「ちゃん(chan)」。",
"keywords": "ボクっ娘 (Bokukko), 怕寂寞"
"magic": "魔女殺手 (奪取生氣)"
我自己會覺得模型閱讀json檔案比較方便
連結我附在下面,有興趣的歡迎拿去研究
接著把這個酷酷的json檔案丟給模型
然後在下指令(prompt)的時候就按照自己想做的方向去下就好了
我自己是這樣下的
內文是同人小說的內容,按照附件的指示進行翻譯,請注意生成的方式要以一句日文一句中文的方式,並在比較複雜的文法或是單詞進行備註,讓我能一邊看一邊學習日文
對,我想順便找回學日文的動力
希望在還在這個坑的期間帶點有用的東西走
至少過完這個寒假讓我還能飛過日檢啥的
總之,我覺得你用這樣的setting丟給gemini 3.0
我覺得這樣就能得到不錯的效果了
我比較在意的是我讓模型翻譯ヒロエマ的時候
艾瑪叫希羅一直叫希羅姊(模型想模仿希羅醬的那種口氣)
不是姊們你們才差不到三個月姊什麼姊阿
我彷彿看到我失敗的期末報告
但那時候我是用比較差的模型(flash)
換成好一點的模型(pro)就有乖乖作instruction following
比較麻煩的問題就是我日文應該了不起就是N4
我自己很難一眼看出來整個翻譯品質有沒有達標
就是我沒有一個baseline讓我了解翻譯的品質
如果有一個方法會database能夠對這種翻譯方式作evaluation
我才能知道是不是json檔的內容不足
還是prompt的指示不夠完備等等
那這個就是技術面的問題了
所以這個就是一個簡單到
可能連workshop等級都沒有的可愛小project
順便幫自己學習語言
之後還會有一個跟這個相關
然後是跟fiXmArge(魔女語)有關的小計劃
滿有趣的小計畫,我還有跟大金(我的指導教授)討論過
對這個有興趣的可以期待一下,先賣個關子
那你說這樣翻譯的CP值如何
直接講可能沒什麼感覺,所以我拿去google AI的playground試了一下
這部分我是翻譯クロ紅茶老師的這篇
いつかやってくるその時まで(直到那一天的到來)
いつかやってくるその時まで
內容大概是ヒロエマ和シェリハン的double date
還有希羅內心OS的各種吐槽
你們才幾歲阿交往才多久就要結婚
對不起我壞習慣常常會叫出來吐槽我還是很喜歡這篇文的嗚嗚嗚
這個有關遊戲設定的json大概佔3721個token
加上內文4851個字(日文)大概是6,087個token
output出來(加上前面提到的輸出日文的教學內容)大概是6,789個token
如果你是架API服務的話
這樣總花費是
Input token cost: $0.012174
Output token cost: $0.081468
Total cost: $0.093642
一篇文章翻譯好3塊台幣
挖省一頓早餐可以讓你看二十篇二創,聽起來是不是很棒
總之軍火展示一下現在的模型可以作到什麼樣的程度
json檔案都歡迎拿去研究
之後可以開一個gemini和GPT的bot來用
但不要把翻譯後的文章拿去轉載什麼的
自己默默拿去玩就好
總之大概是這樣
如果還有什麼佳作也都歡迎分享給我
我也想知道,最近好缺糧
或是技術面上有什麼時作面上可以implement更好的方法的話
也歡迎在底下聊聊你的看法
-------------------------------------
真的是太有效率了www
lofter很常看到有人在說但一直沒有去晃過,不知道到底該不該辦個帳號但又好麻煩(喂
結果podcast做完羽影老師就分享這一篇給我www
ハングドガールズ少見的希羅主動告白
然後後篇還有那個的部分營養均衡這一部分
欸不對他們不是才15歲來著...
發瘋啦嚴厲斥責 不可以不可以不可以 什麼東西啦拜託冷靜一點好不好