技術 - 知勢 - 提供AI新知與觀點的媒體

DeepSeek-R1 技術效應：AI 真的「頓悟」了嗎？

最近，AI 界最受關注的話題之一，莫過於 DeepSeek-R1 這款推理模型 (Reasoning Model)。與傳統大語言模型 (Large Language Model, LLM) 不同，推理模型在回答問題時，會包含「思考」或「推理」過程，使其更適合處理複雜任務 (無法一步到位)，例如數學解題、程式競賽問題，甚至邏輯推理。因此，如摘要、翻譯或基於知識的較簡單問答，並不需要使用推理模型。但隨著 R1 的熱度飆升，也有不少人們開始反思：這是否真的代表了推理模型的突破？還是說，還有其他更高效的方式能達成類似效果？

LLM, 論文快讀, 技術

AI大模型的硬體瓶頸與探討（三）：硬體瓶頸的四大延伸討論

硬體成本是大模型運用時必須面對的挑戰，本篇文章將從電腦架構演變、成本與耗電、硬體卸載、端雲共生等四大面向切入，探討各自發展的可能。

LLM, 論文快讀, 技術

AI大模型的硬體瓶頸與探討（二）：無論雲端還是地端，始終面臨的問題

接續上一篇「從深度學習到大語言模型」，介紹了語言模型的發展與使用方式後，這一篇將探討大模型在落地上，可能會遇到的硬體問題，以及目前發展出的克服方法。

LLM, 技術, 論文快讀

AI 大模型的硬體瓶頸與探（一）：從深度學習到大語言模型

深度學習訓練AI：像教小朋友學東西現在的深度學習是數據驅動（Data-Driven）的技術，訓練深度學習模型就像教小朋友學習新知識。最關鍵的步驟是準備教材（數據）來教導小朋友，這些教材通常放在圖書館中（記憶體或硬碟）。接著，需要準備一個教室（硬體設備）來進行教學，常見的是GPU（圖形處理單元）。GPU是一間設備完善的教室，裡面有較為彈性的工具和資源，讓小朋友可以有效率地學習。每次訓練AI模型，小朋友會去圖書館搬一些數據，回到教室反覆閱讀數據並嘗試解答，重覆上述過程並且不斷修正小朋友的大腦（模型權重）。當AI模型完成訓練後，就像小朋友畢業，具備了基本回答和解決特定問題的能力。當提出問題時，小朋友能根據所學到的知識來給出回應，這就是AI模型的預測階段。

生成式AI, 論文快讀, 技術

生成式 AI 並非橫空出世，那些關鍵的技術突破與發展

自從 ChatGPT 在 2022 年底出現，並掀起一陣 AI 討論熱潮後，隨著各式生成式 AI 工具的出現，除了大眾開始感受到生活與工作方式將逐漸受到影響，各大科技巨頭相繼發表最新模型技術，紛紛投入這場大型語言模型競賽中，包括 Meta 推出 V-JEPA 模型、Google 的 Gemini ，以及 OpenAI 的影片模型 Sora。

實作應用, 技術

AI 如何應用在瑕疵檢測上

瑕疵檢測是許多製造業中關鍵的品質控制環節，傳統的瑕疵檢測方法主要依賴人工檢測或基於規則的方法，這些方法儘管具有一定程度的效果，但仍有不夠精準、效率低下和容易受到環境變化影響等問題。隨著人工智慧技術的發展，特別是機器學習和電腦視覺的進步，瑕疵檢測領域的技術不斷推陳出新，不僅可結合傳統手法提升準確率，還能透過生成式 AI 輔助生成訓練用的瑕疵資料，讓瑕疵檢測更精準、更符合快速更迭的產線週期。

論文快讀, 技術

優化結構以減少運算量，YOLO v10 實現端到端即時物件偵測的目標

YOLO（You Only Look Once）是一種即時物件偵測系統，自2015年首次提出以來，已經在電腦視覺領域引起了廣泛關注。這項技術的主要創新在於其高效、快速的物件偵測方法，使其在實際應用上都佔有一個重要的地位。在每一代 yolo 的發展都是在即時性與精確度上進行討論。

Langchain, 技術, 實作解析

利用 Langchain 實作系列 RAG 進階流程：Query Analysis & Self-reflection

檢索增強生成 (Retrieval Augmented Generation, RAG) 是近期的熱門應用技術之一，但要建立一個足夠穩定的 RAG 架構，並不容易。本篇文章著重在 RAG 技巧中的流程設計與調整，帶領大家快速了解一些實用的 RAG 模組，也透過實際操作，學習 LangChain 與 LangGraph 工具

MLOps, 實作解析, 技術

從資料到模型，以 MLOps 精神實作 AI 模型訓練

過去在 DL 模型的開發過程中，要追蹤大量的資料和實驗結果可能需要結合多項工具，形成較高的學習成本；針對這些問題，HPE 推出 MLDM、MLDE 作為解決方案，使用者只需要熟悉這兩項工具，就能包辦大部分的開發工作，而實際使用的體驗也讓我們認為是值得一試的。