技術

此標籤共有 23 篇文章

白話解讀:為什麼AI應用語言學觀點可以提早捉到病毒變異?
技術, 技術解析, 自然語言處理

白話解讀:為什麼AI應用語言學觀點可以提早捉到病毒變異?

我們能不能將病毒蛋白的基因序列想像成類似人類的自然語言?這又跟快速掌握病毒變異有什麼關係?而人工智慧又能幫什麼忙?從這幾個問題出發,學者們透過自然語言處理(NLP, Natural Language Processing)生成蛋白質序列並縮短預測病毒突變的時間。這究竟是如何做到的?

  • 王文傑
小數據條件下的語意分析
技術, 技術解析, 自然語言處理

小數據條件下的語意分析

幾乎所有的語言分析應用場景的先決條件就是「數據量要大,愈大愈準」。但如果某個專業領域裡面只有寥寥數篇相關文件,例如新產品的行銷文案、專業技能的訓練課程講稿內容乃至候選人的政見發表或是辯論文字稿…等。我們有什麼辦法能讓「人工智慧」幫我們透過少量的數據,就做出像人的判斷呢?

  • 王文傑
模型解析:AI如何讀懂病毒「語言」協助防疫
技術, 技術解析, 自然語言處理

模型解析:AI如何讀懂病毒「語言」協助防疫

近日台灣疫情再度升溫,儘管疫苗已經開始施打,但隨著COVID-19病毒持續變異,傳播能力也不斷上升,未來對於病毒的研究更顯重要。科學家從語言模型的角度出發,解析如何將原本用於學習人類語言的 AI 語言模型,應用來學習病毒變異的語言,或許將有助未來病毒疫苗的設計。

  • 蔡源鴻
爬蟲開發者必學:讓 Python 讀懂「滑動驗證碼」
技術, 實作應用, python

爬蟲開發者必學:讓 Python 讀懂「滑動驗證碼」

動態網頁與靜態網頁最大的不同是資料是在什麼時間點取得的,動態網頁是在瀏覽器已經取得 HTML 後,才透過 JavaScript 在需要時動態地取得資料。因此,爬蟲程式也必須要考慮動態取得資料這件事情,才有辦法正確地找到想要的資料。「滑動驗證碼(Slider Captcha)」是驗證碼機制當中常見的典型,也是防範爬蟲程式中一種難纏的對手。這一篇文章將會利用 Python 、opencv 與 Selenium 三個工具,示範如何拆解和模擬滑動驗證碼。

  • 張維元
從Python到爬蟲,給新手學習地圖與策略
技術, 實作應用, python

從Python到爬蟲,給新手學習地圖與策略

資料爬蟲是資料分析的起手式,必須有好的、可用的資料才得以進行高品質的資料科學專案。而過去的資料來源多半來自於公司內部的資料庫或資料倉儲系統,仰賴於工程師跟 IT 部門的支援。但隨著 Big Data 的技術到位,實務上對於資料的要求更加大量也更加多元。因此,利用程式與資料爬蟲收集資料是目前資料來源的一個重要的管道。

  • 張維元
Attention Is All You Need:關於Transformer你所需要知道的關鍵論文
技術, 自然語言處理

Attention Is All You Need:關於Transformer你所需要知道的關鍵論文

Transformer這個由Google 在 2017 年提出的架構,許多知名的模型像是 BERT 與 GPT-3 等,都是奠基在這個架構上,可說是當前在自然語言處理最強大的模型。近來甚至在電腦視覺領域也可看到 Transformer的蹤影。還想多瞭解一點Transformer 的優點嗎?