GPT-3 4

[스크랩] 실시간 정보로 대화 가능한 혁신적인 AI 챗봇 '블렌더봇 2.0'! 오픈 소스로 공개

1. 내용 OpenAI의 GPT-3, 페이스북 AI의 블렌더봇 첫 번째 버전과 같이 지금까지 개발된 유명한 인공지능(AI) 언어 생성 모델은 적어도 진행 중인 대화의 맥락에서 명확하고 현실적으로 보이는 텍스트를 생성할 수 있었습니다. 하지만 해당 모델들은 매우 짧은 기억력을 갖고 있고, 개발 단계에서 학습된 데이터를 기반으로 말하기 때문에, 이후에 대화를 통해 얻은 지식은 학습되지 않습니다. 즉, AI 언어 모델과 대화하면서 오늘 일어난 일을 말해주고, 내일 다시 물어보면 오늘의 일을 기억하지 못한다는 뜻입니다. 또, 알고리즘의 결함으로 이전에 학습된 정보가 정확하거나 구체적인 정보가 아닐 수도 있습니다. 이에 페이스북 AI 연구소(Facebook AI Research)는 지속적으로 접근할 수 있는 장기..

[스크랩] 화웨이, GPT-3 넘는 최대 2,000억 개의 매개변수 포함한 초거대 언어 AI 모델 '판구 알파(PanGu Alpha)' 공개

1. 내용 GPT-3가 공개된 지 11개월이 지났습니다. 1,750억 개의 매개변수를 갖고 있던 GPT-3는 역사사 가장 뛰어난 언어 인공지능 모델로 평가받으며, 그만큼의 언어 생성 성능을 보여줬습니다. 그러나 대부분 영어에서 우수한 성능을 보인다는 점, 공학·자연과학 분야에서는 비교적 약한 모습을 보인다는 점 등에서 아직은 한계를 보여주기도 했습니다. 여기에서 지난 5월 26일, 중국 화웨이에서 GPT-3를 넘는 최대 2,000억 개의 매개변수를 포함하는 750GB로 대규모 자연어 처리(NLP) 모델인 '판구 알파(PanGu Alpha)'를 개발 및 공개했습니다. 화웨이 연구팀은 이 초거대 언어 모델 설계에서 트랜스포머 기반 자기 회귀 언어(Autoregressive Language) 모델을 기본 아키..

[행사] 'NAVER AI NOW' 후기

1. 내용 행사는 두 파트로 나뉘어서 진행되었으며, 각 파트별로 6개, 8개의 짤막한 세션 영상이 연속으로 재생되는 형태로 진행되었습니다. 모든 세션은 네이버가 선보일 Big AI의 시작, 'HyperCLOVA'를 기반으로 구성되었습니다. 첫 번째 파트는 'HyperCLOVA, 커다란 가능성을 열다'라는 주제로 HyperCLOVA에 대한 전반적인 설명, 의미 등을 담고 있었으며, 아래와 같은 세션으로 진행되었습니다. 두 번째 파트는 'HyperCLOVA 테크놀로지'라는 주제로 첫 번째 파트보다 더 자세하고 구체적인 기술적 관점에서 HyperCLOVA를 설명했습니다. 실제로 HyperCLOVA를 활용한 애플리케이션을 예시로 보여주고, NAVER가 이 HyperCLOVA를 구현하면서 부딪힌 문제, 해결방안,..

[스크랩] LG "세계 최고 수준 '초거대 AI' 하반기 공개"

1. 내용 기존 AI는 특정 카테고리에서만 기능 수행이 가능했던 반면, '초거대 AI'는 대규모 데이터 입력을 통해서 여러 분야를 망라하는 만능 AI를 만들 수 있는 이른바 '꿈의 기술', 'AI의 끝판왕'으로 칭해지는 기술입니다. 특히 기존 AI와 다르게 별도의 데이터 레이블링 작업이 필요하지 않고, 특정 용도에 한정되지 않고, 종합적인 사고와 판단을 할 수 있다는 점에서 인간의 뇌 구조에 가장 근접했다고 평가받고 있습니다. 현재 초거대 AI는 구글, 네이버, 오픈AI, 센스타임 등의 국내외 빅 테크들이 치열한 기술 확보 경쟁을 펼치고 있으며, 국내에서 LG가 제조업 분야 중엔 처음으로 초거대 AI 기술에 1억 달러(약 1,130억 원)를 투자할 것을 발표했습니다. 현존하는 가장 뛰어난 초거대 AI는 ..