技術

此標籤共有 93 篇文章

GAN的基礎應用分享:如何合成逼真的車牌影像
技術, 實作解析

GAN的基礎應用分享:如何合成逼真的車牌影像

車牌作為汽機車的身分證,車牌辨識在門禁、執法與行駕等情境中非常重要,其技術需要很多代表性的車牌作為訓練集,但是車牌影像取得不僅困難、還有隱私的考量。那麼,我們能不能利用cycleGAN相關的image-to-image技術,以及使用styleGAN相關的image generation技術等,合成出逼真的車牌影像增加資料的豐富性?

  • AIF Editor
實事求是,做能落地的NLP應用
技術, 實作解析

實事求是,做能落地的NLP應用

「自然語言處理」又稱為 NLP(Natural Language Processing),為近年來十分熱門且挑戰性十足的研究領域,針對不同的任務類型,我們會選擇不一樣的解法以達到最佳表現成效。舉例來說,目前的 DL 模型擅長解決類似選擇題的分類問題 (Grouping Problem),提供兩篇新聞,讓模型判斷這兩篇文章是否相似、同一類型與否。但如果要讓它判斷兩個句子是否有前後文的邏輯因果關係,或是不同語句的語意是否相同,對 DL 模型而言是困難的。

  • AIF Editor
強AI來了?DeepMind新推通才代理模型Gato
技術, 論文快讀

強AI來了?DeepMind新推通才代理模型Gato

在近期的 AI Research,我們在弱人工智慧(Artificial Narrow Intelligence) 領域中,不斷推陳出新、突破天花板、創造新的演算法。我們針對任務收集相關知識下的資料,並訓練其模型。同時造就了各個領域及行業中的 AI 工程師,但你有沒有曾經想過,未來會有一個 AI 模型能夠分析所有任務,回答你所有問題,取代掉數個領域的 AI 模型呢?

今天你要GAN什麼 : GAN的基礎理論與應用
實作解析, 技術

今天你要GAN什麼 : GAN的基礎理論與應用

GAN被譽為是21世紀最難被訓練的類神經網路之一,近五年來,有非常多的學者都針對GAN進行探討,不管是演算法的更新或是實際應用在其他領域,都有非常多的paper發表。除了生成圖片,還可以做到很多事情,如:五線譜生成、文章生成,甚至小說生成,可生成的東西非常多。只是台灣較常用使用在瑕疵檢測、超解析度(Super Resolution),以及圖片修復。到底什麼是GAN?主要可以應用在哪些地方?本篇文章一次解答。

  • AIF EVENT
Transformer會是最強的視覺辨識模型?要不要試試新設計的CNN模型
論文快讀, 技術

Transformer會是最強的視覺辨識模型?要不要試試新設計的CNN模型

CNN是近年來圖像分類任務中大家的優先選項之一。從2012年的AlexNet開始至今,許多學者相繼針對CNN based模型進行改進。近年來除了大家耳熟能詳的ConvNet based模型外,包括GoogleNet、ResNet等,也開始引進在NLP任務中大獲成功的Transformer架構,如:Swin Transformer。