데일리 미션/Article

Article : 생성형 AI 만난 '시리'는 어떻게 똑똑해질 수 있을까?

pipiiiiii 2024. 8. 1. 16:22

https://yozm.wishket.com/magazine/detail/2696/

 

생성형 AI 만난 ‘시리’는 어떻게 똑똑해질 수 있을까? | 요즘IT

빅테크 기업 치고는 유독 인공지능에 소극적이었던 애플의 행보가 최근 들어 심상치 않습니다. 애플은 지난 5월 앤트로픽의 클로드를 탑재한 iOS용 모바일 앱을 발표한 바 있는데요. 최근에는 자

yozm.wishket.com

 

 

<아티클 내용 요약>

애플은 지난 5월 앤트로픽의 클로드를 탑재한 iOS용 모바일 앱을 발표했는데, 최근에는 자사 AI 플랫폼 '애플 인텔리전스'를 발표하며 오픈 AI의 최신 멀티모달 AI 모델 'GPT-4o'를 탑재할 계획을 밝히기도 했다. 더 나아가 애플은 올해 9월 자가 기기에 구글의 제미나이(Gemini)를 활용하기 위한 파트너십 체결에 대해서도 발표할 예정이다. 

 

이로써 애플은 생성형 AI 기술의 선구자 격인 오픈AI, 구글, 앤트로픽 3사를 모두 아우르는 생성형 AI 플랫폼을 바탕으로, 자사 프로덕트를 고도화할 야심 찬 계획을 구체화하고 있다. 

 

사실 시리(Siri)는 그동안 스마트 어시스턴트라는 명칭이 무색하게 답답한 모습으로 악명이 높았지만 최신 생성형 AI 기술로 무장하게 될 시리는 다를 것이다. 

 

 

시리의 아키텍처

시리 아키텍처는 크게 두 가지 주요 기술인 자연어 처리(NLP)와 음성 인식(Voice Recognition)을 기반으로 구성되어 있다.  

  1. 자동 음성 인식(ASR)
    컴퓨터가 음성 데이터를문자로 바꾸어 인식하는 자동 음성 인식(Automatic Speech Recognition)은 음성 데이터로 된 사용자의 명령을 시리가 이해할 수 있도록 문자 데이터로 변환하는 과정이다.  

  2. 자연어 처리(NLP)
    텍스트로 변환된 데이터를 다루는 자연어 처리(Natural Language Processing)은 자동 음성 인식(ARS) 부분에서 웨이크업 이벤트가 발생하면 시리 서버가 활성화되고, 음성 데이터가 시리 서버로 전달된다. 

시리 서버와 연동된 데이터 팩에는 시리의 언어 모델과 지식 기반 데이터가 포함되어 있는데, 이 부분이 시리의 성능을 결정짓는 두뇌와 같다. 텍스트 데이터 전처리와 토큰호를 거친 데이터는 기존의 RNN과 LSTM, GPT와 같은 Transformer 기반의 딥러닝 기반 알고리즘을 통해 사용자의 명령이나 질문의 의도를 파악하고 답변을 생성한다. 

 

위의 과정을 모두 거친 뒤 시리는 이를 다시 음성 데이터로 변환하여 사용자에게 전달한다.

이런 과정들을 거쳐야 사용자는 iOS에 설치된 시리 클라이언트를 통해, 음성 피드와 동작 제어 결과를 받아볼 수 있다. 

 

 

생성형 AI 기반 시리는 기존과 어떻게 다를까?

기존의 시리는 비교적 단순한 딥러닝 모델들을 기반으로 한 아키텍처에 의존했지만, 최신 생성형 AI 모델인 GPT-4와 제미나이 그리고 Claude와 같은 모델을 탑재하면서 자연어 이해 및 처리 능력이 비약적으로 향상된다. 

 

생성형 AI는 기존 딥러닝 기반 언어모델과 비교해 어떤 점이 다를까?

  1. 방대한 양의 매개변수와 사전 학습 데이터
    방대한 양의 텍스트 데이터를 통해 사전 학습된 생성형 AI 모델은 문맥을 이해하고, 복잡한 질문이나 명령을 처리하는데 훨씬 뛰어나다. 이를 통해 시리는 사용자가 무슨 말을 하는지 더 잘 이해할 수 있다. 그리고 사용자가 같은 요청을 여러 가지 다양한 표현으로 말할 때도 유연하게 인식하고 대처할 수 있다. 

  2. 개인화된 경험 제공
    사용자의 이전 상호작용과 선호도를 학습하여 더욱 개인화된 경험을 제공할 수 있다. 이는 사용자에 대한 데이터가 쌓이면 쌓일수록, 점점 더 똑똑한 개인 비서로 진화할 것이다. 

  3. 멀티모달 인터페이스
    생성형 AI 모델들은 기본적으로 텍스트뿐만 아니라, 이미지, 비디오 등의 다양한 데이터를 처리할 수 있는 멀티모달 인터페이스를 기반으로 한다. 

 

 

스마트 어시스턴트의 미래는?

이제 시리는 생성형 AI 기술을 통해 완전히 다른 수준으로 진화하고 있다. 빅스비나 알렉사 같은 스마트 어시스턴트도 마찬가지다. 생성형 AI는 대화의 맥락을 이해하고 학습하여, 사용자의 복잡한 요구사항을 더 정확하고 유연하게 대응할 뿐만 아니라 누구보다도 나를 잘 아는 개인 비서로 진화하고 있다. 

 

그러나 개인 데이터를 바탕으로 생활 패턴이나 사생활 정보까지 모두 알고 있는 스마트 어시스턴트에 대한 경계도 늦춰서는 안된다. 

 

 

 

 

<알게 된 개념>

나는 빅스비도 시리도 잘 사용하지 않는 편이라서 크게 생각해보지 않은 시스템이었지만 이번 아티클을 통해 앞으로 어떤 방향으로 빅스비와 시리가 사용될 것인지 예측해볼 수 있었다. 

 

아티클에서 말한 영화 '그녀'에 등장하는 사만다가 이미 현실이 됐다는 것은 영화 '아이언맨'에서 토니 스타크가 사용하던 인공지능들을 우리도 이제 사용할 수 있다는 점일까? 

 

만일 그렇다면 편리하겠지만 또 다른 문제는 없는지 혹은 영화 '아이, 로봇' 처럼 되지는 않을지 다양한 생각을 하게 된다.