글로벌 블록체인 선도 기업인 니어 프로토콜이 세계 최대 규모의 오픈 소스 인공지능(AI) 모델 개발에 착수했다. 일리야 폴로수킨 니어 프로토콜 창립자 는 2017년 발표된 구글의 '트랜스포머' 논문 공동 저자 8명 중 유일하게 블록체인 분야로 진출한 인물이다.
코인텔레그래프는 10일(현지시간) 니어 프로토콜이 태국 방콕에서 열린 '리덱티드 컨퍼런스'에서 1조4000억개의 매개변수를 갖춘 AI 모델 개발 계획을 발표했다고 보도했다.
이 모델은 니어 AI 허브(Near AI Hub)를 통해 여러 연구자와 기여자의 크라우드소싱된 연구 데이터로 바탕으로 하는 '분산 학습' 방식으로 구축될 예정이다. 이 프로젝트는 10일부터 5억개의 작은 매개변수를 가진 모델 훈련을 시작으로,, 총 7개 모델을 점차적으로 확장하는 식으로 진행된다.
폴로수킨 공동 창립자는 "약 1억6000만달러(약 2200억원)의 컴퓨팅 비용이 들지만, 이는 암호화폐를 통해 모금 가능한 자금"이라고 말했다.
또 “이 모델을 사용할 때 발생하는 추론 비용은 토큰 소유자에게 상환된다”라며 “비즈니스 모델과 수익화 방법, 자금 조달 방안을 마련해, 사람들이 차기 모델에 재투자할 수 있는 구조를 만들 계획”이라고 덧붙였다.
즉 니어 프로토콜은 대형언어모델(LLM)을 훈련하기 위해 중앙 집중화된 단일 컴퓨팅 클러스터 대신, 전 세계적으로 분산된 컴퓨팅 자원을 활용하는 탈중앙화 방식을 도입한다. 이를 통해 누구나 컴퓨팅 자원을 제공해 AI 모델 학습에 참여할 수 있으며, 기여자들의 컴퓨팅 자원을 모아 방대한 컴퓨팅 파워를 확보할 계획이다.
이와 관련, 구글 딥마인드 역시 전 세계에 분산된 하드웨어를 통합해 모델을 개발할 수 있는 분산 훈련 프레임워크 ‘오픈디로코(OpenDiLoCo)’를 선보인 바 있다.
이런 방식은 통신 빈도를 줄여 분산 훈련 시 필요한 대역폭을 줄이며, 각 클러스터에서 가중치 평균을 종합적으로 계산하고 외부 옵티마이저를 통해 공유 모델을 업데이트하는 과정을 반복해 다양한 컴퓨팅 환경에서도 효율적으로 모델을 훈련할 수 있게 한다.
특히 AI 연구를 소수의 자금력 있는 기관에만 의존하지 않고 학습 과정을 탈중앙화하여 개방적 협력을 촉진한다는 점에 의미가 있다. 이를 통해 다양한 관점을 반영한 학습 과정을 거쳐 ‘오픈 소스 인공일반지능(AGI)’의 기반을 마련할 수 있을 것이라는 평이다.
다만, 이 방식이 실제로 원하는 결과를 낼 수 있을지는 입증된 바 없다. 니어 프로토콜도 큰 장애를 넘어야 한다고 인정했다.
또 니어 프로토콜은 여기에 기존 사업 분야인 블록체인까지 끼워 넣었다. 이번 프로젝트가 어떤 결과를 낳을 지 관심이다.
출처 : AI타임스