Alane
2 weeks ago
[AI][動畫電影票房]測試

來看看AI能不能完成這個稍嫌繁瑣的工作
但是PDF處理得太差,搞不好得用excel檔
latest #22
Alane
2 weeks ago
因為目前有gemini跟copilot較高的使用權限,先用這兩邊試試
Alane
2 weeks ago
條件:簡易整理後的原始檔,跟9個每周票房的檔案,不過一開始先1對1看看
https://images.plurk.com/4RGOh4zKrIyFmHfb9xwDZd.png
當發現每週票房中有相應名稱電影時,整理出每週票房的累積票房欄位資訊
https://images.plurk.com/4dxgpaxGS81mucirVFk6ot.png
https://images.plurk.com/1W9o2XT7d2pvQDC056Pe3F.png

預期不確定因素:
PDF欄位跨行,無法正確判斷數字或文字,電影名稱未100%統一
Alane
2 weeks ago
先試著這樣問問看
https://images.plurk.com/5HmkKMHcy7qaiQXmRKIB63.png
立即下載
booker
2 weeks ago
之前有幫朋友整理網拍賣場的資料... 困擾也是差不多, 沒自動化前東西命名規則不統一, 就很難做得完美.
Alane
2 weeks ago
就第一次結論來說,「完全失敗」
PDF內根本沒有這幾個項目
https://images.plurk.com/3i53TXGKRp5ulgiaiDGM9v.png
Alane
2 weeks ago
先改成下載xls檔再試一次
Alane
2 weeks ago
第2次 gemini給出了能力限制的說明https://images.plurk.com/32K9yYGJOh7pZYjrwMXImt.png
Alane
2 weeks ago
同樣的問題,也拿去給微軟自家的copilot
booker
2 weeks ago
直接讀檔的話, 我通常是請他寫一個 python 程式... 不過這就得先花時間學會弄好 python 環境了.
Alane
2 weeks ago
copilot先謹慎的跟我確認了幾個步驟,而且如預期的,確實有著不完全相符問題,其中也包括「這樣不該判斷成相似」的案例
https://images.plurk.com/4tEyACQnk5W0qHwBHAV88i.png
Alane
2 weeks ago
扣掉上面問題的話,初步看過去沒問題
https://images.plurk.com/5kmmmdu69kqLPUMr1UIyBL.png
Alane
2 weeks ago
實際比對則要分2個部份,缺了哪些需判斷,是否有完全沒判斷成功的,欄位是否正確回傳
Alane
2 weeks ago
啊,又是票房統計那邊的問題,咒術迴戰0被新增一筆2025/10/24開始的項次了
Alane
2 weeks ago
碰碰狐和貝貝彬歡唱電影:奇幻世界大冒險
這個在詢問相似度清單內,沒列出算正常
Alane
2 weeks ago
雖然在需要做大量確認時,就確定效率不會更高了
Alane
2 weeks ago
但除此之外的正確率是足夠的,那麼接下來就是進行正式版的測試

在我的手動流程中,需要一週一週這樣看,但是後面的日期一定大於前面日期,所以只需要抓最後面的資訊,只是偶爾也會出現那些N年前電影的新增票房,而且要同時處理亞洲與歐美兩塊
Alane
2 weeks ago
https://images.plurk.com/13QqyqOZooIiPrJ7KLb1Kn.png

先不提手動合併這點的話,COPILOT的同時處理上限是3個檔案
Alane
2 weeks ago
對我自己來說的困擾是「找出那些在更早的日期出現的電影」,而對AI來說則是必然性的得多做很多用不到的白工(更早之前得票房)
Alane
2 weeks ago
不過在第2批檔案上去之後,他同一串的記憶功能仍然會記得「哪個是最多票房的」,所以其實還是能省下時間
Alane
2 weeks ago
而且他到後來連列都懶了,直接吐給我excel檔
Alane
2 weeks ago
67%相似度,這沒救XDDD
https://images.plurk.com/7FyFX66sX4a8pBVdp1afdK.png
Alane
2 weeks ago
中途才請他去做歐美果然不行,無法正確重計,不過歐美這塊本來複雜度就相對低,我順便還是手動檢查一輪,只是比較不用填數字
back to top