Wonderland🎠

GPT-4o, 보고 듣고 말하는 인간이 되다

엄청난 것이 나와버렸다.😱

영화 HER 가 드디어 등장했다 ㄷㄷㄷ

GPT-4의 업그레이드! GPT-4o 등장

5월 13일(미국시간) OpenAI가 라이브영상을 통해 GPT-4o을 공개했다.

이 모델은 GPT-4의 지적능력은 그대로 가져가면서도 처리속도(응답속도)가 엄청 개선되었다고 한다.

그래서 지연시간이 느껴지지 않을 정도의 실시간으로 정보를 인식, 처리, 반응할 수 있는데,

(심지어 한국어 처리 능력도 토큰 소모량이 1.7배나 줄어들었다고.)

더 놀라운 점은, 텍스트와 음성 정보 뿐 아니라, 실시간 영상도 인식이 가능해졌다.

글만 보면 “요즘 이런거 다 되는거 아니었어?” 할 독자분들이 많을 것이라 생각한다.

맞다.

근데 요즘 다 되는 그 것을 뛰어넘은 것이 나와버렸다…

우리같은 일반인들은 어려운 기술용어들을 나열하면 알아듣기 힘드니, 일단 OpenAI에서 공개한 시연 영상들을 함께 보자.

1. 라이브 발표 영상

- YouTube

Enjoy the videos and music you love, upload original content, and share it all with friends, family, and the world on YouTube.

와,, 사용자가 음성으로 대화를 하는데, 딜레이(지연시간)가 그냥 없는 수준이다.

뭐 이런게 다 있어.. 무서워..

필자는 박스안에 누구 숨겨놓고 얘기하는 줄 알았다.

실시간 대화를 넘어 외국어 실시간 통역을 하고, 화상통화를 하는 듯한 영상 인식능력을 보여준다.

심지어 AI가 말하는 도중에 사용자가 끼어드는 것도 너무 자연스럽게 소화한다 ㄷㄷㄷ

2. 실시간 대화(with 풍부한 감정)

실시간 대화를 하는데, 사용자가 강아지(Bowser)를 보여주자 엄청난 감정표현을 하면서 대화를 이어나간다.

보고 듣고 말하는데 감정표현까지. 무쳤다무쳤어.

ChatGPT는 극 F인게 분명해. 너T야?

3. 실시간 대화(다자간 화상회의)

화상 컨퍼런스콜을 하는 5명의 인간이다. 아니아니 4명의 인간과 AI다.

뭐 그냥 한 명이 카메라만 끄고 있을 뿐, AI인지 도무지 알 수가 없다.

회의내용 요약부터 목소리에 대한 좋은 피드백까지 갓벽하다ㄷㄷㄷ

회의내용 정리를 나보다 잘하면 나는 이제ㅠㅠ

4. 실시간 대화(AI와 AI)

그럼 AI끼리 대화시켜보자!!

를 실제로 해보았다ㅋㅋ

두 AI가 서로 이야기를 나누다가 끝에 가서는 노래도 나눠부른다 ㄷㄷㄷ

AI에게 ‘다른 AI와 대화해봐’ 하는 명령과 상황도 명확하게 인식한다. 특히 중간에 사람이 끼어들어 장난치는데, AI가 시치미 떼다가 ‘뭐 특이한 점 없었어?’ 하니까 그제야 봤다고 대답하는 장면은 ‘이거 사람아니야?’ 하는 생각이 계속 들게한다.

그럼 이제 사용해봐야지?

GPT-4o는 텍스트/이미지 기능부터 바로 사용 가능하고, 음성기능은 차차 몇 주 내로 유료유저에게 공개한다고 한다.

Desktop 앱도 발표했는데, 현재 화면을 같이 보면서 AI와 대화할 수 있다. MAC버전은 바로 다운받을 수 있고, Win버전은 연말까지 만들어준다고 한다.

아무래도 MS가 투자를 더 해야할 듯?

https://pitchbook.com/news/articles/vc-ai-future-beyond-text-gpt-4o-launch 
• “This is nothing unexpected, this is not ahead of schedule or behind, it’s right on time.”

발전속도가 너무 무쳤다고 생각했는데, 오늘 Pinch의 리포트를 보니, 이건 ‘빠른 것도 느린 것도 아니고 제 속도’란다 ㄷㄷ

당장 여름부터 세상이 어떻게 더 바뀔지 가늠이 안된다.

심지어 내일은 구글에서 Gemini 업그레이드 발표가 있다는 거😱😱

내일이 왔다.. 발표했다. 보러가자👇👇👇

Project Astra: 구글이 만드는 차세대 실시간 AI 비서는?
Project Astra: 구글이 만드는 차세대 실시간 AI 비서는?

구글의 혁신 3부작: 문송한 자의 Google I/O 2024 엿보기 (1) 구글 딥마인드의 멀티모달(음성,시각,청각 등) 실시간 AI 비서 Project Astra를 알아보자. (GPT-4o의 대항마?)

근데, 그거 알아?

ChatGPT(GPT-4)보다 좋은 성능으로 테스트 사이트에 나타난 의문의 GPT2가 커뮤티에 난리였었다.

발표가 끝난 뒤, 알고보니 그 GPT2가 이 GPT-4o 였다는 후문.

GPT2 소동에 대해 알고싶다면 👇👇👇
논란의 갑툭튀 GPT2 모델(1)
논란의 갑툭튀 GPT2 모델(1)

GPT2 알아보기, 무료로 사용해보기

Subscribe to our newsletter

Get the latest news and updates from our team