OpenAI가 자사 API에 새로운 음성 모델을 추가하다
OpenAI 오디오 모델이 GPT-Realtime-2, Translate, 그리고 Whisper를 음성 앱에 제공합니다 개발자 친화적인 가격으로 더 풍부한 통화, 실시간 번역, 빠른 전사를 구축하세요
OpenAI는 자사의 API에 세 가지 새로운 오디오 모델을 도입했습니다: GPTRealtime2, GPTRealtimeTranslate, GPTRealtimeWhisper. 이 모델들은 개발자들이 더 효과적으로 추론하고, 실시간으로 음성을 번역하며, 사람들이 말하는 동안 오디오를 텍스트로 변환하는 음성 앱을 구축하는 데 도움을 주도록 설계되었습니다.
GPTRealtime2는 GPT5급 추론 기능을 갖춘 회사의 첫 음성 모델로, 더 복잡한 요청을 처리하고 자연스러운 대화 흐름을 유지하는 데 초점을 맞추고 있습니다. GPTRealtimeTranslate는 70개 이상의 입력 언어에서 13개 출력 언어로의 실시간 음성 번역을 지원하며, GPTRealtimeWhisper는 지연 시간이 짧은 스트리밍 음성텍스트 변환을 제공합니다.
OpenAI는 이 도구들이 고객 지원, 여행, 교육, 행사, 비즈니스 워크플로우와 같은 애플리케이션을 위한 것이라고 밝혔습니다. 또한 Realtime API의 안전 제어 기능을 강조하며, 새로운 모델들이 현재 제공 중이고 개발자를 위한 가격 정보도 공개되었다고 말했습니다.