人の感情を推測し読み取るAI「R1-Omni」をAlibabaがオープンソースで公開しダウンロード可能に – GIGAZINE
Alibaba Group Holdingが、人間の感情を読み取る能力を備えたAIモデル「R1-Omni」を公開しました。動きと音を通じて感情を分析することが可能とのことです。GitHub - HumanMLLM/R1-Omnihttps:/
Alibaba Group Holdingが、人間の感情を読み取る能力を備えたAIモデル「R1-Omni」を公開しました。動きと音を通じて感情を分析することが可能とのことです。GitHub - HumanMLLM/R1-Omnihttps:/
ロボットは災害現場や極端な環境など、人間による救助や捜索が困難な場所で活動することが期待されていますが、複雑な地形を乗り越える能力を小型ロボットに搭載するにはさまざまな課題があります。そこで日本の大阪大学などの研究チームが、「ゴキブリに電子機器を搭載してサイボーグ化する試み」に取り組んでいます。続
写真投稿系SNSのBeRealは、「2分以内に写真を撮影し投稿して」という通知をランダムに送り、無加工でありのままの写真を共有するよう求めるサービス。通知に従わないといくつかの機能が制限される故にユーザーは必死になって写真撮影を行うためユーザーの「リアルな日常体験」を垣
Micorosoftが「Kennan」というコードネームの携帯型ゲーム機を2025年後半のリリースに向けて開発中であることや、OEMデバイスになる可能性が報じられていましたが、新たに、Kennanの製作をASUSが担当するとの予想が伝えられました。Xbox "Proje
Googleが「Metaやその他の企業が子どもの安全を守る責任をアプリストアに押し付けるべく、さまざまな法案を推進している」と述べ、Google Playなどのアプリストアに子どもの年齢確認を義務付ける法案を批判しました。続きを読む...ソース元はコチラ
以前は「酒は百薬の長」といわれたり、適量の飲酒は体にいいといわれたりしていましたが、適量であっても脳や心臓の健康を損なうとの研究結果が報告されていることから、飲まないに越したことはないとの考え方が主流になりつつあります。しかし、メタボが気にな
GoogleがGemini 2.0をベースに「動作を出力する機能」を追加し、ロボットを操作できるようにしたAIモデル「Gemini Robotics」を開発したと発表しました。同時に高度な空間理解機能を持つ「Gemini Robotics-ER」モデルも発表されています。
Googleが2025年3月12日に、オープンソースで商用利用も認められている大規模言語モデル「Gemma 3」を発表しました。Googleによると、Gemma 3は単一のGPUまたはTPUで実行できる大規模言語モデルとしては世界最高のモデルとのことです。Gemma 3
2025年03月12日 11時53分 メモ 2025年3月11日に、Googleによるアイトラッキング技術を専門とするカナダのスタートアップ「AdHawk Microsystems」の買収に向けた交渉が最終段階に入っていることが報じられました。買収
2025年03月13日 09時00分 広告 水拭きとゴミ吸引の両方に対応したNarwalのロボット掃除機「Freo Z10」は、人の手のようなバイオメカニカルモップでしっかりと隅々まで汚れを取り除き、同時に逆回転アクションで毛絡みを自動で解消するサイ