論文快讀

此標籤共有 16 篇文章

當 LLM 的觸角延伸到表格資料,有機會一統江湖嗎?
論文快讀, 技術

當 LLM 的觸角延伸到表格資料,有機會一統江湖嗎?

表格資料(Tabular data)是關鍵的機器學習資料。儘管傳統機器學習方法如梯度提升樹(包含知名的 LightGBM 以及 XGBoost)在這方面表現突出,但大型語言模型(LLM)的興起帶來了新的挑戰與機會。本文探討 LLM 如何在未直接接觸資料的情況下分類表格資料,並分析「TabLLM」項目的創新方法和成果。

Mini DALL·E3:透過對話繪製圖片
技術, 論文快讀

Mini DALL·E3:透過對話繪製圖片

DALL·E3 是 OpenAI 在2023年10月發布的圖像生成模型,不過,使用者僅能利用咒語與參數調整,才能繪製出滿意的圖片,在使用的自由度上大幅受限。為此,有研究者提出名為 Mini DALL·E3 的模型,近一步說明這一類利用自然語言處理跟圖像生成模型的架構,讓使用者後續能更有效的應用並生成出貼近想法的圖片

想提高模型準確性?試試利用CO-SNE降低階層結構資料的維度
技術, 論文快讀

想提高模型準確性?試試利用CO-SNE降低階層結構資料的維度

在數據分析時,有一種資料類型是資料間具有階層結構(hierarchical-structure data),例如社交網路、RNA結構等,後續能應用在推薦系統、結構預測等議題上。這類資料通常希望可以在分析時,盡量保持原始的資料結構關係。如果讓很多維度的資料在降維後,仍然保持資料結構的關係,無疑可以大大提高模型預測的準確性。以下是UC Berkeley的Guo等人在2022年6月提出的新方法。