header image for FreeSEED 「台灣製造」大型語言模型計劃

社群專案 FreeSEED 「台灣製造」大型語言模型計劃

計畫推動 WHY NOW

我們認為 DeepSeek 的開源,是台灣幾十年來難得一遇,可以打造出一款能處理繁體中文,又具備推理能力的大型模型的機會。目前,我們已有懂得如何訓練模型的人才與 GPU,但仍缺乏資金與合法授權的繁體中文優質資料。

執行方向 HOW

  • 技術重點:
    以 DeepSeek R1 為基礎進行改造,重新訓練並以開源授權釋出模型權重,打造新的模型身份與品牌。
  • 目標里程碑:
    第一階段:對齊西方價值觀,但是會變笨(高機率達成)
    第二階段:讓變笨的模型變聰明(具可行性,但是機率低,需投入更多資源驗證)
    終極目標:當用戶使用繁體中文或是英文時,模型表現比使用簡體中文更好

預算規劃 Budget

執行資金預計為新台幣 3,000 萬元。該筆募款收入為該計劃使用,並會製作獨立財務報表。目前預計開銷:

  • GPU 租賃費用:預計至少訓練兩次模型。
  • 模型網頁代管服務費用:模型訓練完成後,架設服務收集早期用戶回饋,作為後續改善依據。
  • 必要之資料授權費用:一次性資料授權費用。
  • 人事、交通、雜支。
  • 行政管理費:開放文化基金會協助計劃募款、各項財務行政作業之費用。
我們希望再募集新台幣 500 萬元作為預備金,使總募款金額達到新台幣 3,500 萬元。若計劃結束後預備金尚有結餘,將全數捐贈給中央研究院。

團隊夥伴 Team Members

  • Liang-Bin Hsueh 薛良斌:計畫召集人
  • Yenting Lin 林彥廷:Taiwan LLM 開發者,具備中文大型語言模型訓練經驗。
  • Wesley Kuo 郭榮昌 & Ubitus 團隊:擁有大規模 GPU 叢集管理實務,獲得晶片大廠 NVIDIA 破億元投資。
  • 許永真教授:計劃顧問。

合作夥伴 Project Partner

  • 開放文化基金會:具有豐富社群合作經驗,提供完整的法人服務。給與募款、財務及行政上面的協助,並且也能以第三方中立角色提供開源專案託管於基金會底下。

參考資訊 information