見出し画像

【2025年】論文輪読会まとめ【NABLAS】

こんにちは!NABLASです!
NABLASでは世界トップクラスのAI研究開発拠点となることを目指し、ディープラーニング技術に強みのあるリサーチャーやソフトウェア開発の経験が豊富なエンジニアなどが集まり、日々研究開発を行っています。
業務中にキャッチアップした、最新のAI技術に関する論文の中で社内全体に共有したいものをピックアップし、隔週で論文輪読会を行なっています。

今回のnoteは昨年に引き続き、2025年に行われた輪読会で登場する論文と、弊社メンバーが作成した資料のスライドのまとめ記事となっています。輪読会が行われる度に最新のものを先頭に追加してまいります。追加タイミングに関してはXにてお知らせしておりますので、Xも合わせてご確認ください。


Moshi: a speech-text foundation model for real-time dialogue

2025.01.29
音声認識やテキスト生成を統合した単一のAIモデル「Moshi」について説明しています。従来の音声チャットボットの制約を克服し、低遅延でスムーズな対話を実現する画期的なシステムです。


xGen-MM (BLIP-3): A Family of Open Large Multimodal Models

2025.01.15
画像と言語を統合するマルチモーダルAIモデル「BLIP-3」の特徴と仕組みについてまとめた資料です。シンプルな設計と効率的なデータ処理がもたらす可能性に注目しています。


2025年にNABLASで開催された論文輪読会の紹介でした。最新AI技術や生成AIに興味のある方はぜひコーポレートサイトもご覧ください。
インターンをはじめ、リサーチャー、エンジニア、ビジネス職など、幅広く募集もしております。オンラインでカジュアルに私たちとお話ししてみませんか?ぜひ上記コーポレートサイトWantedlyLinkedinからご連絡くださいませ!