음성인식 앱 개발에 흥미가 있던 터라 이끌려 사게 된 책이다. 내용은 음성인식의 과거, 현재, 미래를 이야기 하며 음성인식이 가져올 산업구조의 변화에 대해 이야기한다. 이를 위해 현재 구글, 아마존, 애플, 마이크로소프트와 같은 글로벌 IT 기업에서 음성인식 관련해 어떤 행보를 보이고 있고 어떤 패권다툼이 있는지 이야기 한다. 평소 음성인식 앱 개발에 있어 이렇게 해야할 것 같다, 저렇게 해야할 것 같다고 생각했던 것들이 여러 IT 기업들에서 동일하게 고민한 바 있어 바른 방향으로 생각했구나 하는 작은 희열감을 느꼈고, 차마 생각이 닿지 못했던 부분들에 대해 알 수 있어 좋았다. 

 

1부: 경쟁

- 음성은 만능 리모컨화 되고 있고, AI 스피커는 집안 내 모든 가전제품을 제어하는 '허브'역할을 할 것이다. 

- AI 스피커는 음성이란 특성상 사무실보다 가정에 적합할 것이다.

- 음성의 검색결과는 구글과 달리 하나만 보게 될 것이고, 그 결과 검색엔진 상단의 콘텐츠 노출 경쟁이 심화될 것이다.

- 음성은 구글의 수십억달러짜리 광고 비즈니스 모델을 위협한다. 

- 클라우드 덕분에 마이크와 와이파이 칩만 있으면 어떤 디바이스도 음성인식 장치가 될 수 있다.

- 회사들은 사활을 걸고 지배적인 새 OS를 개발하기 위해 고군분투 중이다.

- AI에게 페르소나 부여가 필요하다. 페르소나가 있는 AI 스피커의 앱 사용율이 더 높다. (by Google)

- AI는 수십년간 차세대 거대시장으로 기대받았지만 안정적 이윤창출을 성공한적이 없다.

- 구글은 1,700개 이상의 액션을 보유 중이다.

 

2부: 혁신

- 세계 최초 챗봇은 엘리자다. 1960년대 중반 MIT에서 만들어졌고 심리치료사 역할을 했다. 이후 1972년 심리치료챗봇 패리(Parry)가 스탠퍼드 대학 정신과 의사에 의해 만들어졌다. 

- 대화 중 이어지는 다음 말이 올 수 있는 순열은 무한하다. 예상대로 대화를 흘러가도록 만들 수 없다. 

- 한 가지 주제에 집중한 챗봇은 그나마 만들 수 있다.

- 수학자 조지 불 이름을 딴 게 불(Bool) 논리다. 측량사 조지에베레스트 이름 딴 산이 에베레스트 산이다.

- 친밀감과 효율성은 Trade-off 적 성격을 띤다. 개인적 따듯함과 직업적 냉정함 사이의 균형이 필요하다.

- 구글의 AI 스피커 설계에 있어 핵심 원칙 중 하나는 사람처럼 말하되, 사람인 체 하지 않는 것이다.

- 희곡에선 강한 견해가 캐릭터를 흥미롭게 하는 요인이지만 AI 스피커 설계에 있어선 양극화를 일으키지 않을 정도의 성격을 만들어야 한다.

- 사용자들은 각각 고유한 AI 비서를 찾고 있다. 따라서 사용자 범주별 맞춤형 성격을 만들필요가 있다. 

- 각자 전문성을 갖춘 작은 모델로 나눠 앙상블을 구성했을 때 더 좋은 평점을 받았다. 

 

3부: 혁명

- 구글이 찾아주는 100만 개 링크는 시리의 정확한 답변 하나보다 훨씬 가치가 낮다.

- 원샷 답변이란 단 하나의 정확한 답변을 제공하는 것이다.

- 웹캠과 동작추적센서로 표정분석할 수 있다. 또 말 속도, 길이, 어조 분석을 통해 현재 상태에 대한 단서가 될 수 있다. 

- 자제력과 같은 것은 프로그래밍이 쉽지 않다. 또 시간 구분 감각에 대한 프로그래밍이 필요하다.

- 훌륭한 사람은 물론 강한신체와 운동능력을 겸비해야겠지만 고귀한 정신, 부드러운 마음, 고상한 영혼은 수 많은 미덕의 출발점이다.

- 거대 기술 기업이 어디로 향할지 미리 알아 보는 좋은 방법은, 그들의 특허 신청 서류를 검토해보면 된다.

+ Recent posts