FreeSEED 「台灣製造」大型語言模型計劃 | 財團法人開放文化基金會 (OCF)

【社群專案】FreeSEED 「台灣製造」大型語言模型計劃

我們以 DeepSeek R1 為基礎，透過重新訓練與改善，打造出一個符合台灣需求的開放模型權重的大型語言模型。這個模型會專注於繁體中文與英文，讓它在這兩種語言的文字表現遠優於簡體中文，且具備民主價值。這不只是技術專案，更是文化與價值工程。

主辦

FreeSEED 大模型製作委員會

相關連結

「台灣製造」大型語言模型計劃 | 首頁「台灣製造」大型語言模型計劃 | 公版計劃書「台灣製造」大型語言模型計劃 | 募款頁

計畫推動 WHY NOW

我們認為 DeepSeek 的開源，是台灣幾十年來難得一遇，可以打造出一款能處理繁體中文，又具備推理能力的大型模型的機會。目前，我們已有懂得如何訓練模型的人才與 GPU，但仍缺乏資金與合法授權的繁體中文優質資料。

執行方向 HOW

技術重點：
以 DeepSeek R1 為基礎進行改造，重新訓練並以開源授權釋出模型權重，打造新的模型身份與品牌。
目標里程碑：
第一階段：對齊西方價值觀，但是會變笨（高機率達成）
第二階段：讓變笨的模型變聰明（具可行性，但是機率低，需投入更多資源驗證）
終極目標：當用戶使用繁體中文或是英文時，模型表現比使用簡體中文更好

預算規劃 Budget

執行資金預計為新台幣 3,000 萬元。該筆募款收入為該計劃使用，並會製作獨立財務報表。目前預計開銷：

GPU 租賃費用：預計至少訓練兩次模型。
模型網頁代管服務費用：模型訓練完成後，架設服務收集早期用戶回饋，作為後續改善依據。
必要之資料授權費用：一次性資料授權費用。
人事、交通、雜支。
行政管理費：開放文化基金會協助計劃募款、各項財務行政作業之費用。

我們希望再募集新台幣 500 萬元作為預備金，使總募款金額達到新台幣 3,500 萬元。若計劃結束後預備金尚有結餘，將全數捐贈給中央研究院。

團隊夥伴 Team Members

Liang-Bin Hsueh 薛良斌：計畫召集人
Yenting Lin 林彥廷：Taiwan LLM 開發者，具備中文大型語言模型訓練經驗。
Wesley Kuo 郭榮昌 & Ubitus 團隊：擁有大規模 GPU 叢集管理實務，獲得晶片大廠 NVIDIA 破億元投資。
許永真教授：計劃顧問。

合作夥伴 Project Partner

開放文化基金會：具有豐富社群合作經驗，提供完整的法人服務。給與募款、財務及行政上面的協助，並且也能以第三方中立角色提供開源專案託管於基金會底下。

參考資訊 information