목차

  • 인공지능의 개념
  • 최초의 계산 시스템
  • 인공지능의 역사
  • 앨런튜링 - 인공지능의 개념적 토대를 놓다
  • 다트머스 컨퍼런스
  • 기호주의와 연결주의
  • 첫 번째 AI 겨울과 AI의 부활
  • 두 번째 AI 겨울과 AI의 부활

 

인공지능의 개념

 

인공지능은 인간의 학습능력, 추론능력, 지각능력, 자연언어의 이해능력 등을 포함하는, 지능을 갖춘 컴퓨터 프로그램을 의미한다[1]. 이러한 인공지능의 목표로는 연산속도가 빠른 컴퓨터에 인간의 지능을 부여함으로써 효율적인 문제 해결을 도모하기 위함이다. 이러한 인공지능에 대해 이후에 언급될 지능과 생각 등이 무엇인가에 대한 튜링 테스트나 중국어 방 사고실험과 같은 철학적 관점의 문제가 제기되기도 한다.

 

최초의 계산 시스템

 

Pascaline최초의 계산기라 불리는 시스템은 1642년에 파스칼이라는 학자가 고안한 것으로, 파스칼린이라는 이름의 계산기로 세금계산서에 나오는 덧셈과 뺄셈을 위해 만들어졌다. 이후 1672년경에 철학자인 라이츠니츠가 곱셈을 처리할 수 있는 계산기를 고안했고 1694년에 Stepped reckoner라는 이름으로 완성되었는데, 이러한 라이프니츠의 업적은 0과 1 혹은 On과 Off로 표시할 수 있는 이진법을 개발해 현대식 컴퓨터(디지털) 개발에 초석을 놓았다는점에 의미가 있다. 이후 1822년 찰스 배비지는 조금 더 현대적인 의미의 컴퓨터를 고안하였고, “차분기관”이라하여 명령들을 해석하며 계산을 실행하는 기계 즉, 프로그래밍 가능한 컴퓨터를 설계하고 제작을 시도하였다.

 

Stepped reckoner

 

인공지능의 역사

1943년 논리학자인 윌터 피츠와 신경과학자인 워렌 맥컬럭이 “A Logical Calculus of Ideas Immanent In Nervous Activity”라는 논문에서 인간의 사고 메커니즘에 해당하는 뉴런의 작용을 0과 1로 이루어지는 이진법 논리 모델로 설명하였고 1946년 범용 컴퓨터인 ‘에니악(ENIAC)’의 등장 이후부터 컴퓨터 연구와 함께 인공지능에 대한 연구가 진행되었다.

 

앨런튜링 - 인공지능의 개념적 토대를 놓다

이후 1950년 영국의 수학자인 앨런 튜링은 “Computing Machinery and Intelligence”라는 논문을 발표하였는데, 해당 논문은 생각하는 기계의 구현 가능성에 대한 것으로 “기계가 생각할 수 있는가?”라는 물음을 통해 그 유명한 튜링 테스트가 고안되었고 또한 인공지능에 대한 개념적 토대를 놓게 되었다.

 

다트머스 컨퍼런스

1940년대와 1950년대에 이르러 다양한 영역의 과학으로부터 인공적인 두뇌의 가능성이 논의되었고, 1956년에 마빈 민스키와 존 매카시 등이 개최한 다트머스 컨퍼런스를 통해 현재 AI라 불리는 용어가 정립 되었으며 AI가 학문의 분야로 들어오는 계기가 되었다. 이 컨퍼런스에서 참석자들은 튜링의 ‘생각하는 기계’를 구체화하고 논리와 형식을 갖춘 시스템으로 이행시키는 방법을 두달간 논의하였다. 다트머스 컨퍼런스 이후 AI라는 새로운 학문은 대수학 문제를 풀고, 기하학의 정리를 증명하고, 영어를 학습 등의 발전의 땅을 질주하게 되었다.

 

이렇게 인공지능에 대한 개념적 토대를 놓은 1950년대의 인공지능 연구는 크게 두 분야인 기호주의와 연결주의로 나뉘었다. 기호주의는 인간의 지능과 지식을 기호화, 메뉴얼화하고 이를 따르는 컴퓨터가 있으면 문제 해결이 가능하다는 전제를 기반으로 하며, 이와 관련한 문제로는 체스, 미로, 퍼즐 등이 있다. 이러한 기호주의의 특징은 논리로 해결할 수 있는 문제, 메뉴얼화가 가능한 분야에 강하다는 장점이 존재하며, 영상인식이나 음성인식과 같은 논리로 설명하기 어려운 문제에 약하다는 단점이 있다. 기호주의의 성과로는 수학, 퍼즐, 체스, 미로등과 같은 논리적인 문제를 해결할 수 있게 되었으며 인간과 대화할 수 있는 챗봇이 탄생하게 되었다.

 

이렇게 현실적으로 실현 가능하고 인공지능 기술의 기초가 되는 접근법인 기호주의 분야가 사람들의 관심을 받고 있었으나 1958년 프랭크 로젠블랫이 인공신경망(ANN)의 기본이 되는 알고리즘인 퍼셉트론(Perceptron)을 고안하게 되었고, 사람들의 사진을 대상으로 남자/여자를 구별해내게 되면서 뉴욕 타임즈에 실리게 되었고 이후 인공지능 연구의 트렌드가 기호주의에서 연결주의로 넘어오게 되는 계기가 되었다.

 

연결주의의 경우 뇌 신경 네트워크의 재현을 목표로 하는 접근법으로, 인공지능 학습에 있어 좋은 경험(정보)가 있으면 문제를 해결할 수 있다는 전제를 기반으로 한다. 인간 또한 어떠한 방법을 통해 생각 하는지 알지 못하기에 말로 설명할 수 없는 문제의 경우 경험으로 배우는 것이 효과적이라는 것으로 현재의 기계학습으로 연결된다. 이러한 연결주의의 특징으로는 인간이 메뉴얼로 만들 수 없는 복잡한 문제여도 인공지능이 스스로 답을 찾을 수 있다는 점이다. 이러한 연결주의의 성과를 통해 앞서 언급한 퍼셉트론이 탄생하게 되었다.

기존의 기호주의를 이끌던 마빈 민스키는 연결주의에 비판적인 시각으로 1969년 『퍼셉트론』이라는 책을 출간하면서 기존의 연결주의의 한계 즉, 퍼셉트론의 한계를 수학적으로 증명하게 된다. 퍼셉트론의 경우 XOR 연산이 근본적으로 불가능한 모델이며, 실생활 적용에 있어 한정적이라는 사실을 비판하게 되면서 연결주의에 투자되어 있던 자금이 빠지기 시작하고, 1971년 로젠 블랫의 사망, P-NP 문제와 같은 기호주의의 한계를 다루는 논문이 인공지능이 조합의 증가(Combinational Explosion)을 다룰 수 없다고 발표되면서 소위 AI Winter라 불리는 시기가 15년동안 지속되는 계기가 되었다.

 

첫 번째 AI 겨울과 AI의 부활

마빈 민스키에 의해 퍼셉트론은 AND, OR, NAND와 같은 선형문제는 해결할 수 있으나, XOR과 같은 비선형 문제는 선형분리가 불가능하다는 한계로 인해 도래했던 첫 번째 AI 겨울은, 1986년 현재 딥러닝의 아버지라 불리는 제프리 힌튼 교수가 다층 퍼셉트론(Multi-Layer Perceptron)과 역전파(Backpropagation) 알고리즘을 제시하면서 기존의 XOR의 한계를 극복할 수 있는 것을 실험적으로 증명하게 되면서 AI가 부활하게 되었다.

 

정확히는, 1974년 하버드대의 Paul Werbos가 퍼셉트론 환경에서의 학습을 가능하게 하는 역전파 알고리즘을 고안하였고 인공지능에 대한 침체한 분위기 속 8년 후인 1982년 논문이 발표되었다. 또한 1982년 물리학자인 John Hopfield는 완벽히 새로운 경로에서 정보를 처리하고 학습할 수 있는 신경망의 형태를 증명하였고, 이 시기에 David Rumelhar는(Paul Werbos에 의해 발견된) 역전파라 불리는 신경망을 개선하기 위한 새로운 방법을 알리고 있었다. 이후 역전파 알고리즘과 다층 퍼셉트론은 1984년 얀 르쿤에 의해 다시 세상 밖으로 나오게 되었고, 병렬처리 형태로부터 영감을 받아 1986년 제프리 힌튼에 의해 세상에 알려지게 되었다.

 

두 번째 AI 겨울과 AI의 부활

다층 퍼셉트론과 역전파 알고리즘을 기반으로 1990년대 초반까지 문자 인식 및 음성 인식과 같은 프로그램의 구동 엔진으로 사용되면서 인공지능 연구에 발전을 이루었으나 Vanishing Graidnet(그래디언트 소실)과 Overfitting(과적합) 문제, 컴퓨팅 파워와 같은 한계점이 발견되면서 AI의 두 번째 겨울을 맞이하게 되었다. 하지만 꿋꿋히 인공신경망을 연구해오던 제프리 힌튼 교수는 2006년 “A fast learning algorithm for deep belief nets”라는 논문을 통해 신경망의 가중치의 초기값을 잘 설정한다면 DNN(Deep Neural Network)을 통한 학습이 가능하다는 것을 밝혀내면서 본격적으로 딥러닝이라는 용어가 사용되기 시작했으며, 2012년 제프리 힌튼 팀이 ILSVRC(ImageNet Large Scale Visual Recognition Challenge)라는 이미지 인식 경진대회에서 AlexNet라는 모델을 통해 당시 매우 힘든일이라 판단되었던 오류율을 큰 폭으로 낮추게 되면서 압도적인 우승을 차지했고 이후 다시금 AI의 부흥기가 시작 되었다.

 

Reference

[1] https://ko.wikipedia.org/wiki/인공지능
[2] https://brunch.co.kr/@storypop/28
[3] https://insilicogen.com/blog/340
[4] https://pgr21.com/freedom/57391
[5] Logo

[바겐 세일] - 생각 처분

 

이 책은 과거 철학자들이 값비싸게 산 생각을 우리에게 저렴한 가격에 판매한다. 더불어 사용법도 친절히 알려준다. 여기서 친절하다는 의미는 철학하면 어렵게 받아들여질 수 있는 내용보다 누구나 읽더라도 쉽게 이해할 수 있는 내용으로 구성되어 있다는 것이다.

이 책은 과거 한 프로젝트를 수행하는 동안 멘토님으로부터 철학이 중요하다는 사실을 느꼈고, 한 사람의 성장을 위해서는 반드시 필요한 것이라 생각했다. 그러던 중 제목과 띠지에 이끌려 사게 된 책이다. 다행히도 처음인 내게 어려운 개념은 없었다. 내용 구성은 철학사의 시간축 중심이 아닌 핵심 개념 중심으로 크게 4가지인 사람, 조직, 사회, 사고로 구성하였다.

[사람] 전반적으로 타인과 자신의 사고방식과 행동양식에 관한 깊은 통찰을 준다. 여기서 흥미롭게 읽었던 부분은 타인이 무엇을 말하려 하는지 더욱 정확히 이해하려면 그 사람이 무엇을 부정하는지를 아는 것이 중요하다고 한 것이다. 이후 철학자의 말을 설명하기 위해 무엇을 부정했는지를 중심으로 설명하였다.

[조직] 전반적으로 집단에 속한 인간이 보이는 행동에 대해 설명하였다. 여기서 흥미롭게 읽었던 부분은 크게 두 부분이었다. 첫번째로는 이해할 수 없는 사람과 함께 일해야만 하는 이유에 대한 것이었다. 결론적으로 누구에겐 정답인 것이 누구에겐 정답이 아니기 때문이며, 타자의 관점을 배움과 깨달음의 계기로 삼는다면 지금까지와 다른 관점과 가치관을 획득할 수 있다는 것이다. 2년전 읽을 때 까지는 크게 느끼지 못했지만 지금은 이를 실천하는 것이 쉽지 않은게 몸소 느껴진다. 이를 타개하기 위해선 다른 관점에서의 접근과 함께 결합돼야 실천 가능할 것이라 생각된다.

두 번째는 상대에게 협력할 것이냐 배신할 것이냐에 관한것이었다. 이와 관련한 대회로 단 3줄의 프로그래밍 코드로 협력/배신 게임에서 이긴 핵심 비결은 간단했다. 처음에만 협력카드를 내밀고 이후에는 바로 직전에 상대가 내민 카드를 따라 내는 것을 반복하는 것이다. 여기에는 상대가 배신했다가 협력하더라도 깔끔히 잊고 미래를 위해 협력하기 때문에 포용성이 있고, 상대가 협력하다 배신하면 나 또한 배신하여 상대에게 패널티를 줄 수 있다는 것이다. 비록 대승적인 차원에서는 옳지 않을 수 있으나 현실적인 측면에서는 유용할 수 있지 않을까 한다.

[사회] 전반적으로 사회의 성립과정과 메커니즘에 대한 이해와 관련된 내용을 설명한다. 여기서 흥미롭게 읽은 한 실험이 있었다. 개미들이 일정 시간 내에 거주지로 운반해오는 먹이량에 대해 시뮬레이션하는 것이었다. 여기에서 영리한 개미와 멍청한 개미가 있다. 똑똑한 개미는 앞서 있는 개미의 페로몬을 쫓아 정확하게 먹이를 운반하지만 어리숙한 개미는 제대로 쫓아 가지 못해 잘못된 길을 가거나 돌아갔다. 하지만 결과는 어리숙한 개미가 먹이를 가지고 돌아가는 효율이 중장기적으로 더 높다는 사실이었다. 이는 똑똑한 개미가 가는 길이 반드시 최단경로가 아니었고, 오히려 어리숙한 개미가 에러로 들어선 경로가 생각지도 못하게 최단경로를 발견하게 되었다는 것이다. 결론적으로 단기적인 비효율이 중장기적인 고효율을 가져올 수 있다는 의미를 내포하고 있다 볼 수 있다.

[사고] 사고방식에 있어 함정에 빠질 수 있는 부분에 대해 전반적으로 설명한다. 여기에서는 "결국 OO한 뜻이죠?"라고 요약하는 습관의 위험성과 관련된 내용에 대해 흥미롭게 읽을 수 있었다. 이 습관은 세상을 넓게 바라볼 수 있는 기회를 제한한다고 한다. 또한 커뮤니케이션에서는 듣는 방법의 깊이가 4단계가 있는데 이 습관으로 듣는 방법은 가장 낮은 1단계에 해당한다며, 자신의 내면의 시점에서 생각하는 습관을 경계하고 상위 단계로 나아가야한다고 한다. 결론적으로 자신을 바꾸고 성장을 위해서는 "알았다"고 생각하는 습성을 경계하는 것이 핵심이라 할 수 있다.

"모든 분야에서 발견과 견문을 가져와 인류와 사회, 그리고 세계의 온갖 현상에 관해 자유자재로 통찰을 담아내는 학문이 철학이다" - 야마구치 슈

별점: ⭐️⭐️⭐️⭐️

공감이란 무엇인가?

책의 핵심은 충조평판하지말고 존재 자체에 주목하여 공감하라는 것이다. (충조평판 = 충고, 조언, 평가, 판단)

누군지 기억 나진 않지만 2년전 쯤 페이스북 유명인사 중 한명이 심리학에 관한 좋은 책이 있다하여 찾아보았다. 당시 별점이 9.8이었던걸로 기억한다. 표지도 따뜻한 느낌이었고, 그렇지 않아도 타인에게 조금 더 공감하는 법을 배워보고 싶었다.

책을 읽으며 울게 될줄은 몰랐다. 쓰여진 문장 하나하나가 나로 하여금 내 마음을 돌아보게 했기 때문이다. 시중 베스트셀러의 단순하고 일시적으로 독자를 위로하는 것과는 깊이가 다름을 느낄 수 있었다. 저자는 30년간 정신과 의사로 활동했고 1만 2천여 명의 속마음을 듣고 나눈 사람으로 공감의 본질에 대한 통찰이 묵직하다는 것을 느낄 수 있었다.

책의 내용은 전반적으로 저자는 정신과 의사들이 우울증이라고하면 슬픔과 고통을 들어보기도 전에 약부터 처방하는 실태에 안타까워한다. 사람들은 자신을 환자가 아닌 고통받는 사람으로 바라봐주길 원하고 깊이 이해해주길 바라기에 약물 중심의 치료는 더욱 고통을 악화시킨다고 한다.

그러면서 공감에는 과녁이 있고 그 과녁은 그 사람의 존재 자체를 향해야 한다고 한다. 또한 무엇을 묻느냐가 아니라 나에게 집중하고 나의 마음을 궁금해하는 사람이 존재하는 것 자체가 치유라고 말하며 따라서 한 사람을 살릴 수 있는 이러한 심리적 CPR을 배우는 것이 중요하다고 한다. 이 때 주의할 것은 그 사람에게 충고, 조언, 평가, 판단은 위험하다는 것이다. 이러한 계몽과 훈계는 나는 모든걸 알고 있고 너는 아무것도 모른다는 전제로 하는 말이기에 본질은 폭력과 같다고 한다.

이 책은 주변지인들에게 부담없이 선물하는 책이다. 한 명은 내게 진심으로 고마워했다. 책 때문인지는 몰라도 후에 내게 신발을 선물해주기도 했다. 바라지는 않았지만 막상 받으니 좋긴 했다. 그보다도 진심으로 이 책을 통해 타인의 삶에 좋은 영향을 줄 수 있었다는 게 좋았다. 많은 사람이 이 책을 읽게 된다면 조금 더 따뜻한 세상이 되지 않을까 한다. 또한 나아가 사람을 얻고 삶의 행복을 얻는 근본적인 방법이 아닐까 한다.

“심리적 목숨을 유지하기 위해서 끊어지지 않고 계속 공급받아야 하는 산소 같은 것이 있다. 당신이 옳다는 확인이다.” - 정혜신

별점: ⭐️⭐️⭐️⭐️

시공간과 차원이란 무엇인가?

우주에는 4대 힘이 있다. 중력, 전자기력, 약력, 강력. 초끈이론은 이러한 자연계의 4대힘과 모든 입자를 하나의 통일된 개념인 초대칭적 끈의 진동으로 기술하고자 하는 이론으로 이 책의 핵심 내용이라 할 수 있다.

2년전 “시간이라는 환상”이라는 주제의 과학 컨텐츠를 접하고 이 책을 읽게 되었다. 당시 전공을 살려 회사의 인턴으로 일하고 있을 시기였다. 하지만 이 책은 열심히도 살아가던 이 삶에 근본적으로 더 중요한 요소가 있음을 어렴풋이 알게된 계기가 되었다. 특히 시간과 차원에 대한 개념에 대해 이해를 하면서부터 였다. 시간이란 것은 단순히 공간의 휨에 의해 발생하고, 우리가 느끼는 과거, 현재, 미래는 우리의 편의를 위해 단순히 개념적으로 나눈 것에 불과하다는 사실이 무지했던 내게는 가히도 흥미로웠다.

이는 과거, 현재, 미래를 구분하는 파티션이 없고 늘어져 있다는 것이다. 4차원 시공간에 살고 있는 우리는 3차원 공간이 무한히 늘어진 즉, 미래가 일종의 무한한 크기의 매트릭스(?)처럼 펼쳐져 있다는 것이다. 이러한 사실(?)을 접했을 때 참으로 신기했던 것이 있었다. 흔히 들어본 운명은 결정되어있는가? 아니면 만들어가는 것인가?에 대한 일종의 관점(?)이었다.

4차원 시공간속에 사는 우리의 미래는 하나 높은 차원에서 모든 것이 결정되어 있다. 3차원 공간에 사는 우리가 컴퓨터로 영화를 볼 때 2차원 스크린에 보이는 영화 상영시간이 전부 정해져 있는 것과 마찬가지다. 하지만 동시에 결정되어 있는 미래 중 내가 매번 하나를 선택해 나간다. 이는 가령 주사위 3번을 던져 전부 같은 숫자가 나올 확률이 1/216일 때 주사위를 던지고 나면 216개의 미래 중 하나가 결정되는 것과 같다.

이렇듯 고차원에선 저차원을 손쉽게 서술할 수 있다. 가령 3차원 공간은 2차원 면을, 2차원 면은 1차원 선을 쉽게 기술할 수 있는 것과 같다. 초끈이론은 이렇듯 자연 전체, 우주 전체를 서술하기 위해서 10차원이 필요하다 말하고, 우리는 느끼지 못하지만 10차원 속에서 살고 있다 주장한다.

이 책을 읽을 당시 정리의 필요성을 느끼지 못해 체계적으로 기록해두지 못한 것에 아쉬움이 든다. 전반적으로 양자역학, 상대성이론, 표준모형, 통일장이론 등의 비교적 최신 과학에 대한 내용이 주를 이루고 이외의 수학과 철학과 관련된 내용이 일부 담겨 있다.

이 책은 내게 인식의 범위 확장에 도움을 주었다는 데에 의미가 있다. 시험을 잘 보기 위해서는 시험 범위를 알아야 한다. 마찬가지라 생각한다. 세상이라는 시험을 잘 보기 위해서는 세상의 범위를 알아야 한다. 세상의 범위는 내가 인식하는 세상의 크기만큼이다. 이러한 관점에서 가장 큰 우주에서부터 우리 은하, 태양계, 지구, 대한민국, 지금의 나의 위치에 이르기까지를 생각해볼 수 있는 기회였고, 또한 단순히 물리적 크기를 떠나 우리 인류는 지금 어디에 있고, 무엇을 찾고 있으며, 어디를 향해 나아가고 있는가? 대해 생각해볼 수 있는 기회였다.

별점: ⭐️⭐️⭐️⭐️

신과 진리는 무엇인가?

책의 핵심은 신과 진리의 존재 여부를 알기 위해 아는 것으로부터 자유로워져야 한다. 신과 진리는 오로지 스스로만 답할 수 있다. 따라서 자신을 이해하는 것이 앎의 시작이다는 것이다.

무지했던 인식과 의식의 규모의 확장은 동양철학적 접근법을 가진 이 책을 비롯해 시작되었다. 철학, 과학, 신학, 수학, 뇌과학 등의 학문에 관심을 갖계된 계기이기도 하다. 세계 4대 성인이 있다. 부처, 예수, 공자, 소크라테스. 이 책은 인도의 위대한 성인으로 불리는 지두 크리슈나무르티가 쓴 책이다. 약 20년간 태어나 책에 관심을 가진적 없었다. 그러나 태어나 한번쯤 들어보았으나 중요치 생각하지 않았던 “나는 누구인가”에 대한 철학적/종교적 견해는 무언가 내가 전혀 알지 못하는 영역이 있음을 깨닫게 해주며 나를 이끌었다.

전반적인 내용은 나는 누구이고 내가 느끼는 감정의 실체는 무엇인가? 삶과 죽음. 그리고 신과 진리는 무엇인가와 같은 철학적 질문에 인식론적 관점으로의 접근이다. 이러한 접근은 종교와 밀접하지만서도 저자는 종교에 얽매이지 말 것을 말한다. 불교와 힌두교의 개념이 사용되는 것 같으면서도 조금은 다른 것이 이 책의 매력인 듯 하다.

2년전 이 맘때 쯤 읽은 책이지만 아직도 제대로된 이해를 하지 못하고 있다. 내용이 축약되어 있다보니 논리 비약된 느낌이다. 한 차원 더 높은 직관을 요구한다. 하지만 이러한 난해함이 책을 몇 번이고 하여금 열어보게 한다. 올바른 이해만 한다면 사물을 있는 그대로 볼 수 있지 않을까 하는 생각 때문이다.

“이 책은 읽을게 아니라 물처럼 마실 일이다. 아니, 우리는 이 책을 숨쉰다. 이 책이 숨이므로.” - 지두 크리슈나무르티


별점: ⭐️⭐️⭐️⭐️

 

맥 환경에 있어 pyaudio 라이브러리를 설치할 경우 에러가 뜬다.

 

해결법은 다음과 같다.

 

  • brew install portaudio

 

  • pip install pyaudio

 

배경


데이터 프레임을 분석하는데 있어 컬럼 명이 존재하지 않아서 별도로 달아주어야 할 경우가 있다.

 

 

해결 코드


column_name = ['column1', 'column2', 'column3', 'column4', 'column5']

dataframe = pd.read_csv(fullpath)

data = frame.values.tolist()

new_dataframe = pd.DataFrame(data, columns=column_name)

 

 

코드 해설


  1. 먼저 생성할 컬럼명을 컬럼의 개수에 맞게 작성을 해준다.
  2. pandas를 통해 분석할 데이터 프레임을 읽어들인다.
  3. 데이터 프레임의 values를 모두 리스트에 넣으며 이때 리스트에 들어가는 각 요소는 데이터 프레임의 한 행이 된다.
  4. pd.DataFrame을 사용하여 columns 인자에 생성한 리스트 변수를 넣어줌으로써 컬럼명이 생성된 데이터 프레임이 생성된다.

 

Taxonomy와 Folksonomy


지식을 chunk화 시켜서 저장을 시키는 뇌의 특성상 무언가를 빨리 받아들이려면 배우고자 하는 지식에 대한 체계화된 범주를 먼저 보거나 만드는 것이 중요하다. 그래서 어릴적부터 많이 듣던 마인드맵이, 흩어져 있는 지식을 하나씩 그려봄으로써 지식을 체계화할 수 있는 것 때문에 효율적인 학습 측면에서 중요하다. 또한 사람이 텍스트나 음성을 이해하는 속도와 대조하여 이미지를 이해하는 속도는 현저하게 차이가 나는데 간략한 예시는 다음과 같다.

 

인공지능이란 머신러닝과 딥러닝으로 구성되어 있고 머신러닝은 지도학습, 비지도학습, 강화학습으로 이루어져 있다. 또한 지도학습에는 분류와 회귀가 있으며 비지도학습에는 차원축소와 클러스터링이 있다.

 

혹시 머릿속에 한 번에 이해가 되는가? 이미 해당 지식에 대해 알고 있는 사람은 비교적 쉽게 이해할 수 있으나 일반적으로 처음 접하는 사람에게 있어서는 이러한 서술적인 텍스트는 별 도움이 되지 않는다. 그보다 오히려 아래와 같이 마인드맵과 같은 시각적인 그림이 있다면 이해하는 속도는 현저히 빨라지게 된다.

 

[그림 1] 머신러닝의 지식 체계 개념도

 

텍스트보다 위의 그림이 훨씬 잘 이해 되는 것을 느낄 수 있을 것이다. 이에 따라 배우는 속도는 어떻게 지식을 습득하느냐에 달려 있다. 그래서 사람들은 이러한 분류 체계를 만드는 것을 중요하게 느끼고 있으며 이를 만든다. 보통 배우고자하는 지식을 한눈에 보기 위해서는 예컨데 다음과 같은 키워드를 사용하면 구글에 검색하면 체계화되어 정리된 지식을 볼 수 있을 것이다.

 

  • The map of [Keyword]

 

  • [Keyword] Cheat Sheet

 

하지만 이러한 키워드를 사용해도 잘 나오는 경우도 있으나 만족스럽지 못한 경우가 있는데 이는 분류체계에도 한계점이 존재하기 때문이다.

 

분류법에는 크게 텍소노미와 폭소노미가 있는데 텍소노미의 경우 특징이 트리형의 위계적 구조로 분류해둔 것을 의미하며 쉽게 생각할 경우 운영체제의 디렉터리와 같다고 생각하면 될 것이다. 하지만 이러한 텍소노미의 단점은 다음과 같다.

 

1. 계층구조나 트리구조 전체를 파악하고 있지 못할 경우 찾고자 하는 지식(데이터)이 어느 계층에 속하는지 찾기가 쉽지 않다.

 

2. 하나의 지식(데이터)이 두가지 이상의 카테고리나 계층에 속할 때 처리의 어려움이 있다.

 

 

폭소노미의 경우 태그에 의한 분류법으로 집단적으로 분류하는 방법을 의미한다. 텍소노미에서 사용하던 디렉터리대신 태그에 따라 나누는 분류 체계로 사람들에 의해 나뉘어지는게 특징이다. 흔히 생각하면 인스타그램의 해시태그를 통해 원하는 키워드와 관련된 정보만 볼 수 있게 하는 것이 폭소노미의 분류법을 적용한 것이다.

 

폭소노미는 비록 텍소노미에 비해 체계적이지는 않으나, 별도의 트리구조 전체를 파악하지 않아도 되고, 필요한 부분만 체계를 만들어나가기 때문에 원하는 지식(데이터에) 접근이 쉽다는 장점이 있다.

 

+ Recent posts