PGR21.com
- 모두가 건전하게 즐길 수 있는 유머글을 올려주세요.
- 유게에서는 정치/종교 관련 등 논란성 글 및 개인 비방은 금지되어 있습니다.
Date 2021/03/03 14:30:40
Name 타카이
출처 https://gizmodo.com/an-ai-was-taught-to-play-the-worlds-hardest-video-game-1846388137
Subject [기타] 기계학습으로도 정복할 수 없는 게임
QWOP
QWOP_screenshot.jpg

더러운 조작감을 가진 게임 QWOP를
기계학습 알고리듬을 이용해 학습시켰지만 만족스러운 결과가 나오지 않아서
QWOP 최고 스피드 러너의 플레잉 50개 영상을 학습시키고 연습시켰지만
speedrun.com 기록상 100m 기록 세계 10위인 1분 8초로 마무리 되었다고 합니다.(1위 기록 48초...)

더 좋은 개발자나 더 좋은 성능의 AI의 도전이 필요합니다.

통합규정 1.3 이용안내 인용

"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
21/03/03 14:32
수정 아이콘
스펠렁키 2 시키면 알파고도 패드 집어던지지 않을까...
40년모솔탈출
21/03/03 15:19
수정 아이콘
스펠렁키 멀티 플레이 전멸콤보 맛좀 봐야...
카라카스
21/03/03 14:36
수정 아이콘
스카이넷을 앞당기고 있네요..
티모대위
21/03/03 14:37
수정 아이콘
현재로서는 기계학습이 효율적이려면 사람이 플레이하는 속도보다 훨씬 빠르게 내부 시뮬레이션,학습이 가능한 환경이 되어야 할듯..
이 게임도 게임의 코드를 통째로 AI에 밀어넣고 고속으로 돌리면 금방 인간을 뛰어넘겠죠.
짬뽕순두부
21/03/03 15:07
수정 아이콘
알파고 : 아 조작감 뭣같네 진짜...!!
21/03/03 15:08
수정 아이콘
이런거 예전에 일본사람이 유전 알고리즘으로 최적화하는거 봤던것 같은데...
-안군-
21/03/03 15:24
수정 아이콘
왠지 설계에 문제가 있었을 것 같은... 딥마인드가 했다면 결과는 달랐을 것 같네요.
기계학습쪽을 요새 좀 파고 있는데, 이게 생각보다 무작정 한다고 되는게 아니더라고요.
어떤 학습방법을 쓸것이고, 피드백은 어떻게 할 것이며, 학습결과가 편향되지 않도록 하는 것 등등 고려할게 엄청 많아요.
21/03/03 15:44
수정 아이콘
유튜브보니 딥마인드 딥큐러닝 논문보고 참고했다고 하네요. 딥마인드 회사 전체도 필요없이 머신러닝 엔지니어 한명이면 될듯
-안군-
21/03/03 15:46
수정 아이콘
DQN 논문은 사실 강화학습 방식에 대한 원론만 제시한거고, 세세한 튜닝에 대해서는 언급이 안돼있죠.
딥마인드 회사 전체도 아니고, DQN 저자중 한명만 있었어도 저것보다는 훨씬 성능이 좋았을것 같긴 합니다.
21/03/03 15:55
수정 아이콘
사실 알파고는 튜닝문제보단 알고리즘과 트레이닝 스케일링 문제라.. 튜닝엔 꽤나 Robust한걸로 알고있습니다.
-안군-
21/03/03 16:01
수정 아이콘
퉁쳐서 튜닝이라 한거죠;,
사실 알파고도 강화학습 방식 자체는 기존의 DQN과 큰 차이는 없다고 보고, 최적화를 위해 몬테카를로 탐색방식을 쓴게 신의 한수라 보거든요.
근데 QWOP 같은 게임은 경우의 수도 적어서 몬테카를로 같은건 필요없을것 같고... 결국은 튜닝과 피드백의 문제일거라고 예상이 되네요.
21/03/03 16:13
수정 아이콘
몬테카를로 탐색은 알파고 전부터 바둑ai 에선 흔히 쓰던 알고리즘입니다.
구글이 엄청난 컴퓨트를 가지고 딥러닝 스케일링과 강화학습 알고리즘 문제를 해결한게 큽니다.
태정태세비욘세
21/03/03 16:05
수정 아이콘
current status를 어떻게 읽었는지가 궁금하네요
숫자인가 화면인가..
Chasingthegoals
21/03/03 16:49
수정 아이콘
A.I도 실습하다가 샷건 쳤을 것 같은데 크크크
21/03/03 18:03
수정 아이콘
사람보다 훨씬 쉽게 잘할거 같은데... 만든사람 능력문젠듯
주파수
21/03/03 20:26
수정 아이콘
저러다가 울트론 나오는 거구나..
목록 삭게로! 맨위로
번호 제목 이름 날짜 조회
426121 [유머] 5에서 2등까지 합쳐도 1등 못 이김 [39] 나주꿀12113 21/06/28 12113
426105 [서브컬쳐] 만화, 혐주의)이토 준지 암울한 세계관 TOP5 [43] 샤르미에티미13011 21/06/28 13011
425352 [서브컬쳐] ??? : NT-R operating system, all green [9] 나주꿀6175 21/06/19 6175
425142 [유머] F1? 기계빨로 가장 안전한 길을 다니는 대회지 [19] 길갈9925 21/06/17 9925
424907 [기타] 친중 아티스트가 그린 G7 풍자도 [22] antidote9421 21/06/14 9421
424684 [유머] 기계생물 복합 매크로.gif [17] prohibit12332 21/06/12 12332
422929 [기타] 디씨 군사갤러리 바이든 치매 밈.jpg [1] 나주꿀11868 21/05/22 11868
422150 [기타] 주토피아 생각나는 일본 택배 송장 기계.gif [24] insane11142 21/05/13 11142
422002 [유머] 여러분은 서른한살에 무엇을 하셨나요? [33] AKbizs11184 21/05/11 11184
421723 [스포츠] 기계 체조 선수의 코어힘 수준.gif [25] TWICE쯔위11827 21/05/07 11827
420398 [유머] 기계화보병이란 단어를 처음접했을때 공감 [15] 추천9722 21/04/23 9722
419433 [기타]  우주의 모든 에너지를 써도 움직일 수 없는 톱니바퀴 [34] TWICE쯔위11488 21/04/13 11488
419231 [스포츠] 축구선수들이 입는 브라자 같은건 왜 입을까 ??? [15] insane20029 21/04/11 20029
419054 [유머] 인간은 기계다.jpg [9] 마늘빵8698 21/04/10 8698
418295 [유머] 스마트폰 액정필름 붙여주는 기계.gif [9] 파랑파랑8188 21/04/02 8188
417832 [기타] 이제 커여운 댕댕이 시간은 지났습니다 [13] Lord Be Goja6509 21/03/30 6509
417470 [게임] 스텔라리스로 알아보는 정화(purge)의 종류 [14] 페스티9172 21/03/26 9172
417394 [기타] 정가에 정직하게 파는 그래픽카드의 운명 [17] Lord Be Goja8077 21/03/25 8077
417169 [게임] 진정한 격투게임판 기여도.. [13] Lord Be Goja8231 21/03/23 8231
416372 [동물&귀욤] 팝콘 기계에 홀린 고냥이 [5] 흰긴수염돌고래7034 21/03/15 7034
415129 [기타] 기계학습으로도 정복할 수 없는 게임 [16] 타카이8208 21/03/03 8208
414732 [LOL] (후방주의) LOL로 저가 코스프레하는 사람.jpg [20] insane16081 21/02/27 16081
414211 [텍스트] 잘린 발가락을 넣은 칵테일.canada [3] 추천7485 21/02/22 7485
목록 이전 다음
댓글

+ : 최근 1시간내에 달린 댓글
+ : 최근 2시간내에 달린 댓글
맨 위로