Google AI
드디어 AI가 본격적으로 등장했습니다.
구글브레인의 새로운 알고리즘 제품군은
AI 소프트웨어를 실행하기 위해 특별히 맞춤형 컴퓨터 칩을 설계할 수 있게 되어
인간 전문가에 의해 설계된 것보다 훨씬 우수합니다.
그리고 이 시스템은 불과 몇 시간 만에 작동하며 일반적으로 디지털 혁신을 방해하는 몇 주에서 몇 달의 과정을 극적으로 절감합니다.
이들 로봇칩 디자이너의 중심에는 딥리인포스먼트 러닝이라고 불리는 기계학습이 있습니다.
이 알고리즘 패밀리는 인간의 뇌의 기능에 대략적으로 기반하고 있으며
체스, 바둑, 그리고 거의 모든 Atari 카탈로그 등의 게임에서 생물학적 신경 영감을 받았습니다.
하지만 게임 플레이는 AI 요원들의 유치원 교육에 불과했습니다.
최근에는 코로나19 신약을 추진하면서 생물학의 가장 큰 과제 중 하나를 해결하고 인간 뇌의 비밀을 밝히도록 성장했습니다.
새로운 연구에서는 보다 효율적으로 실행할 수 있는 하드웨어를 개발함으로써 심층 강화 학습이 현실 세계에서 다시 근육을 유연하게 만들고 있습니다.
게임 플레이의 요소를 능숙하게 칩 디자인의 과제에 도입해 인간 디자이너에게는 전혀 「기묘하고 이질적인」개념을 만들어 냈지만, 그래도 훌륭하게 기능했습니다.
이론뿐만이 아닙니다.
AI 칩 설계 요소 상당수가 회사의 AI 액셀러레이터 칩인 구글의 텐서처리장치(TPU)에 통합돼 AI 알고리즘이 더 빠르고 효율적으로 실행될 수 있도록 설계됐습니다.
"그것이 이 연구에 있어서 우리의 비전이었습니다"라고 연구 저자 안나 골디는 말했습니다.
기계학습이 매우 가능해진 지금 그것은 모두 하드웨어와 시스템의 진보 덕분입니다.
우리는 AI를 사용하여 미래의 AI 알고리즘을 실행하기 위해 더 나은 시스템을 설계할 수 있습니까?
칩 디자인의 과학과 예술
휴대폰이나 노트북 등의 마이크로칩이 집안에 보급되고 있는 것은 별로 생각하지 않지만, 이러한 마음에 드는 디바이스를 제어하는 기반인 하드웨어 「두뇌」입니다.
대부분의 경우 마이크로칩은 계산을 최적화하기 위해 수천만 개의 컴포넌트를 채워 넣는 엔지니어링의 뛰어난 기능입니다.
일상적으로 설계가 나쁜 팁은 로딩 시간이 느리고 죽음의 바퀴가 회전하는 것을 의미합니다.
아무도 원하지 않습니다.
팁 설계의 핵심은 '플로어 플래닝'이라고 불리는 과정입니다."라고 이 연구에 관여하지 않은 Andrew Kahng 캘리포니아대 샌디에이고대 박사는 말했습니다.
새로운 공간으로 이동한 후 가구를 배치하는 것과 마찬가지로
칩 상의 다른 메모리와 로직 컴포넌트의 위치를 이동하여 처리 속도와 전력 효율을 최적화합니다.
그것은 매우 어려운 일입니다.
각 칩에는 계산에 사용되는 수백만 개의 논리 게이트가 포함되어 있습니다.
이를 따라 산재해 있는 것은 매크로 블록이라고 불리는 수천 개의 메모리 블록으로 데이터를 저장합니다.
그 다음, 이들 두 개의 주요 컴포넌트는 수십 마일의 배선으로 상호 연결되기 때문에 속도, 발열 및 에너지 소비의 관점에서 칩은 가능한 한 최적으로 작동합니다.
Kahng씨는 다음과 같이 말하고 있습니다.
이런 경이로운 복잡성을 감안하면 칩 설계 프로세스 자체도 기적적입니다.
전문 소프트웨어 툴을 통해 엔지니어의 노력이 복잡함을 줄일 수 있습니다. 대부분의 경우, 플로어 플래닝에는, 인간 전문가의 세심한 시행착오가 수주에서 수개
월이 걸립니다.
그러나 60년의 연구에도 불구하고 그 과정은 아직 과학과 예술의 혼합물입니다.
Kahng 씨는 특히 지금까지 플로어 플래닝 작업은 자동화 시도를 모두 무시해 왔다고 말했습니다.
한 추정에 따르면, '메모리' 매크로 블록을 배치할 만한 서로 다른 구성의 수는 우주의 별의 수보다 큽니다.
구출을 위한 게임 플레이
이 복잡함을 생각하면 프로세스를 자동화하려는 것은 어리석은 것 같습니다.
그러나 구글브레인은 교묘한 속임수로 그것을 실행했습니다
매크로 블록이나 기타 컴포넌트를 체스말이라고 생각하면 칩 설계는 게임의 한 종류가 되고 이전에 딥리인포스먼트 러닝으로 습득한 것과 같습니다.
에이전트의 임무는 최적화된 방식으로 칩에 매크로 블록을 하나씩 순차적으로 배치해 게임을 이기는 것입니다.
물론 순진한 AI 에이전트라면 고생할 것입니다.
백그라운드 러닝으로서 팀은 1만 개 이상의 칩 플로어 플랜으로 에이전트를 훈련시켰습니다.
해당 지식의 라이브러리를 사용하면 에이전트는 다양한 대체 수단을 탐색할 수 있습니다.
설계 중에는 우리가 학습하는 방법과 비슷한 시행착오의 과정으로 작동했습니다.
플로어 플랜을 작성하는 어떤 단계에서든 AI 에이전트는
학습된 전략을 사용하여 어떻게 기능하고 있는지를 평가하고
다음 컴포넌트를 어디에 배치할지를 결정합니다.
"처음에는 백지 캔버스로 시작해서 칩의 각 컴포넌트를 한 번에 하나씩 캔버스에 배치합니다.
마지막에 그게 얼마나 잘됐느냐에 따라 점수(보상)를 얻을 수 있습니다."
라고 Goldie 씨는 설명했습니다.
이후 이 피드백은 AI 에이전트의 기반이 되는 인공 뉴럴 네트워크 전체를 업데이트하고 다른 라운드에 대비하기 위해 사용됩니다.
점수는 칩 설계의 제약을 따르도록 주의 깊게 만들어져 있지만 반드시 동일하다고는 할 수 없습니다.
각각의 팁은 독자적인 게임입니다.
예를 들어 데이터센터에 도입할 경우 소비전력을 최적화해야 하는 것도 있습니다.
그러나 자율주행차용 칩은 잠재적인 위험을 신속하게 검출할 수 있도록 레이턴시에 더욱 주의해야 합니다.
바이오칩
이 접근법을 사용하여 팀은 하나의 팁 설계 솔루션을 찾는 것만이 아니었습니다.
AI 에이전트는 적응과 일반화가 가능하며 특정 요구에 최적화된 솔루션을 특정하는 데 6시간의 추가 계산이 필요했습니다.
"이들 서로 다른 컨텍스트에서 알고리즘을 일반화하는 것은
하나의 특정 칩에서 기능하는 알고리즘을 갖는 것보다 훨씬 큰 과제였습니다."
라고 골디 씨는 말했습니다.
Kahng씨는 기존 칩 때문에 인간 전문가가 개발한 것보다 뛰어나다는 점에서 일종의 일회성 학습 모드라고 말했습니다.
AI 에이전트가 매크로 블록을 크기가 작은 순서대로 놓은 것이 주된 통로 같았습니다. 하지만 눈에 띄는 것은 디자인이 얼마나 이질적인가 하는 것입니다.
배치는 '둥글고 유기적'으로 각이 진 모서리와 날카로운 모서리를 가진 기존의 칩 디자인과는 크게 달랐습니다.
인간 디자이너들은 이것이 고품질이 될 리 없다고 생각했습니다.
거의 평가하고 싶지 않아 했습니다.
하지만 팀은 그 프로젝트를 이론에서 실천으로 밀고 나갔습니다.
구글은 지난 1월 차세대 AI 프로세서에 AI가 설계한 요소를 여러 개 통합했습니다. 구체적인 내용은 비밀로 되어 있지만,
이 솔루션은 수백만 개의 복사본을 물리적으로 제조하기에 충분할 정도로 흥미로웠습니다.
팀은 칩 설계를 위한 머신의 뇌를 더욱 최적화하고 이해하기 위해
보다 광범위한 커뮤니티를 위한 코드를 선보일 예정입니다.
오늘날의 마법처럼 여겨지는 것들은
더 나은 플로어 플랜 설계에 대한 통찰을 제공하고 점점 느려지고 있는 (또는 빈사의) 무어의 법칙을 확장하여 우리의 계산 하드웨어를 더욱 강화할 수 있습니다.
컴퓨팅 속도나 소비전력을 약간 개선해도 큰 차이가 날 수 있습니다.
Kahng씨는 다음과 같이 말하고 있습니다.
"반도체 업계는 저자의 작품을 복제하는 것에 대한 관심을 배증시켜 칩 설계 프로세스 전체에서 비슷한 애플리케이션의 다수를 추구하기를 기대하고 있습니다."
「모든 종류의 데이터 센터에 도입되고 있는 것을 생각하면, [신세대 칩]이 머신러닝의 이산화탄소 배출량에 미치는 영향의 레벨은, 정말로 중요합니다. 하루만 더 빨리해도 큰 변화가 일어날 것입니다" 라고 골디는 말했습니다.
댓글