以下のソフトウェア・技術を中心に、お客様のニーズに合わせたシステム構築をサポートいたします。
記載のないソフトウェアや技術についても対応可能な場合がございますので、まずはご相談ください。
音声認識
-
Whisper
OpenAIが開発した高精度な音声認識モデル。多言語対応で、様々な音声環境に対応可能。
音声対話・アバターインタラクション
-
MMDAgent-EX
アバター対話型音声インタラクションツールキット。3Dキャラクターを用いた対話システムの構築が可能。弊社取締役 李が開発。
LLM・生成AI
-
ChatGPT / GPT API
OpenAIの大規模言語モデル。対話型AI、文章生成、コード生成など幅広い用途に対応。
-
Claude / Anthropic API
Anthropicの大規模言語モデル。長文理解、分析、安全性を重視した高品質なAI応答を提供。
-
Gemini / Google AI
Googleの大規模言語モデル。マルチモーダル処理に優れ、Google各種サービスとの連携が可能。
-
LLaMA / オープンソースLLM
Metaが開発したオープンソースLLM。オンプレミス環境での運用やカスタマイズが可能。
その他
-
Google音声認識API
Googleが提供するクラウドベースの音声認識サービス。リアルタイム認識やバッチ処理に対応。
-
マルチモーダルデバイス連携
各種センサー・デバイスを組み合わせた、視覚・音声・ジェスチャーなど複合的なインタラクションシステムの構築。