Wonderland🎠

Project Astra: 구글이 만드는 차세대 실시간 AI 비서는?

Google 도 뭘 발표한다고?

아니, 어제 OpenAI에서 GPT-4o 를 발표하면서 엄청난 화제가 되었는데, 사실상 구글에 선빵👊 구글이 바로 다음날 Google I/O(연례 개발자회의) 에서 또 폭탄🧨을 던졌다. 두둥.

GPT-4o, 보고 듣고 말하는 인간이 되다
GPT-4o, 보고 듣고 말하는 인간이 되다

멀티모달기능을 강화한 OpenAI의 GPT-4o 를 알아본다

역시 구글 Geeks 답게, 너무 지루하게 키노트를 해서 기술을 잘 모르는 우리네 일반인을 위해, 흥미로운 것들만 뽑아 엄선하여 추려보았다.

💡
구글의 혁신 3부작: 문송한 자의 Google I/O 2024 엿보기

1편: Project Astra: 구글이 만드는 차세대 실시간 AI 비서는?(이번편)

2편: VEO, Imagen3, Lyria: 공돌이 구글이 예술을 알아?(링크)

3편: 안드로이드Android와 AI의 완전한 합체

Project Astra: next gen. AI Assistant by google

이번 편은 Project Astra! 구글의 차세대 실시간 AI비서이다. 개발중이라 데모만 보여준건 함정

음, 쉽게말해 GPT-4o 에서 영화 ‘Her’를 현실로 보여줬던 충격적인 그것을 구글도 내놓았다고 보면 된다.

차세대 시리가 뭘 할 수 있는지, 너무 굼금하쟈나, 일단 구글에서 공개한 영상부터 볼까?

Project Astra(Google)

확실히, OpenAI는 현장에서 막 실제로 실행하는 것을 보여줘서 그런지 구글은 영상의 임팩트가 매우 떨어진다. 얘들은 왜이리 Geek스러움을 못벗어날까. 갬성 한스푼🥄 이 빠졌자나 으휴

첫 인상

그래도 뭐 어제 본 GPT-4o의 보고 듣고 말하는 것(멀티모달)은 다 되는 것 같다. 중요한 딜레이(지연시간)도 불편함 느끼지 못할 정도로 적은 느낌이다. 대단하다. 미쿡. 우리 잼민이(gemini) 많이 컸구나👶

뭐 쟤(ChatGPT)가 되는거 다 되는 것 같으니 재밌고 신기한건 OpenAI가 다 보여줬고, 귀찮으니 기능만 대충 한번 정리해볼까?

Gemini ‘Live’: 실시간 대화

앞서 언급 했듯, 딜레이(지연시간)이 거의 없는 실시간 소통(대화)이 가능하다. ChatGPT나 구글 Gemini에 텍스트로 뭘 물어봐도 답변이 한 세월 걸렸는데, 진짜 빨라졌다. 특히 필자는 집에서 애플 홈팟이나 구글 홈 스피커를 둘 다 사용중이다. 맨날 뭐 얘기하면 기다리느라 답답했는데, 이것만으로도 엄청 편해질 것 같다.

또한, 대화 중에 문맥을 이해하고, 이전에 했던 말을 기억해서 더 정확하고 유용한 답변을 해줄 수 있는 기능이 강화되었다. 이것도 ChatGPT에서 하나의 대화를 길게 해본 사람은 모두 공감할텐데, 길게 얘기하다보면 얘가 저 앞에서 했던 얘기 까먹고 딴소리하는 상황이 종종 발생한다.쟈증나정말 맥락을 이해하고 입력된 정보를 더 잘 기억해서 조금 더 유연하게 대화를 이어 나갈 수 있다.

읽고 듣고 쓰고 보고 말하고 다 하네?

Multi Modal(멀티모달)이라는 표현이 자주 나오는데, 말 그대로 ‘여러 형태의 서로 다른 감각이나 유형의 정보’ 를 뜻하는 용어다. 어디가서 아는 척하자 멀티모달 AI는 시각, 청각, 텍스트 등 다양한 데이터 유형을 학습하고 통합하여 표현할 수 있는 AI를 뜻한다.

어려운 얘기는 이쯤하고, 결론은 얘도 읽고 쓰고 듣고 보고 말하고 다 할 수 있다는 얘기

source: 이가탄
source: 이가탄

물론 아직 씹고 뜯고 맛보고는 못한다. 하면 안된다.

어디에 사용할 수 있을까?

“내 친구가 카톡으로 보여준 그 예쁜 가방이 저기 저거 맞아?”

Project Astra는 휴대폰이나 스마트 글래스등을 통해 주변 환경을 실시간으로 인식하고, 우리가 말하는 것에 따라 반응할 수 있다. 이렇게 되면 잃어버린 물건을 찾거나, 특정 물건을 식별하는 것도 가능해진다.

“엄빠랑 가족여행가는데 엄마는 더운거 싫어하고, 아빠는 액티비티를 좋아하거든. 내 동생은 맛집 탐방을 좋아해. 예산도 많이 안 들면서 모두를 만족할 수 있는 여행지와 스케줄을 좀 만들어줄래?”
”내가 김치찌개를 처음 끓여보거든. 여기 재료들을 준비했는데 빠진게 있을까? 아, 고춧가루가 이정도 양으로는 안된다고? 배민이든 쿠팡이츠든 가장 빨리오면서 저렴한 것으로 주문해줄 수 있어?”

여행 계획을 세울 때 AI와 함께 일정을 만들고 수정할 수 있다. 뿐만 아니라, 요리할 때 필요한 재료를 알려주거나, 집안일을 도와주는 등의 다양한 작업도 수행할 수 있다. 이러한 기능 덕분에 우리는 손을 쓰지 않고도 많은 일을 할 수 있게 된다. 소파에 누워 “엄마배고파~ 밥 줘” 같은거 쌉가능?

아니, 그래서 대체

스카이넷은 GPT일까, Gemini일까?

그게 누구든 살려만달라🙏

바로 이어서! 2편: VEO, Imagen3, Lyria: 공돌이 구글이 예술을 알아?👇👇👇
VEO, Imagen3, Lyria: 공대감성 구글이 예술을 한다고?
VEO, Imagen3, Lyria: 공대감성 구글이 예술을 한다고?

구글의 혁신 3부작: 문송한 자의 Google I/O 2024 엿보기 (2) 구글의 AI 아티스트 3인조, 생성형 동영상AI, 이미지AI, 음악AI 는 어떤 모습일까

Subscribe to our newsletter

Get the latest news and updates from our team