PGR21.com
- 모두가 건전하게 즐길 수 있는 유머글을 올려주세요.
- 유게에서는 정치/종교 관련 등 논란성 글 및 개인 비방은 금지되어 있습니다.
Date 2021/03/03 14:30:40
Name 타카이
출처 https://gizmodo.com/an-ai-was-taught-to-play-the-worlds-hardest-video-game-1846388137
Subject [기타] 기계학습으로도 정복할 수 없는 게임
QWOP
QWOP_screenshot.jpg

더러운 조작감을 가진 게임 QWOP를
기계학습 알고리듬을 이용해 학습시켰지만 만족스러운 결과가 나오지 않아서
QWOP 최고 스피드 러너의 플레잉 50개 영상을 학습시키고 연습시켰지만
speedrun.com 기록상 100m 기록 세계 10위인 1분 8초로 마무리 되었다고 합니다.(1위 기록 48초...)

더 좋은 개발자나 더 좋은 성능의 AI의 도전이 필요합니다.

통합규정 1.3 이용안내 인용

"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
21/03/03 14:32
수정 아이콘
스펠렁키 2 시키면 알파고도 패드 집어던지지 않을까...
40년모솔탈출
21/03/03 15:19
수정 아이콘
스펠렁키 멀티 플레이 전멸콤보 맛좀 봐야...
카라카스
21/03/03 14:36
수정 아이콘
스카이넷을 앞당기고 있네요..
티모대위
21/03/03 14:37
수정 아이콘
현재로서는 기계학습이 효율적이려면 사람이 플레이하는 속도보다 훨씬 빠르게 내부 시뮬레이션,학습이 가능한 환경이 되어야 할듯..
이 게임도 게임의 코드를 통째로 AI에 밀어넣고 고속으로 돌리면 금방 인간을 뛰어넘겠죠.
짬뽕순두부
21/03/03 15:07
수정 아이콘
알파고 : 아 조작감 뭣같네 진짜...!!
21/03/03 15:08
수정 아이콘
이런거 예전에 일본사람이 유전 알고리즘으로 최적화하는거 봤던것 같은데...
-안군-
21/03/03 15:24
수정 아이콘
왠지 설계에 문제가 있었을 것 같은... 딥마인드가 했다면 결과는 달랐을 것 같네요.
기계학습쪽을 요새 좀 파고 있는데, 이게 생각보다 무작정 한다고 되는게 아니더라고요.
어떤 학습방법을 쓸것이고, 피드백은 어떻게 할 것이며, 학습결과가 편향되지 않도록 하는 것 등등 고려할게 엄청 많아요.
21/03/03 15:44
수정 아이콘
유튜브보니 딥마인드 딥큐러닝 논문보고 참고했다고 하네요. 딥마인드 회사 전체도 필요없이 머신러닝 엔지니어 한명이면 될듯
-안군-
21/03/03 15:46
수정 아이콘
DQN 논문은 사실 강화학습 방식에 대한 원론만 제시한거고, 세세한 튜닝에 대해서는 언급이 안돼있죠.
딥마인드 회사 전체도 아니고, DQN 저자중 한명만 있었어도 저것보다는 훨씬 성능이 좋았을것 같긴 합니다.
21/03/03 15:55
수정 아이콘
사실 알파고는 튜닝문제보단 알고리즘과 트레이닝 스케일링 문제라.. 튜닝엔 꽤나 Robust한걸로 알고있습니다.
-안군-
21/03/03 16:01
수정 아이콘
퉁쳐서 튜닝이라 한거죠;,
사실 알파고도 강화학습 방식 자체는 기존의 DQN과 큰 차이는 없다고 보고, 최적화를 위해 몬테카를로 탐색방식을 쓴게 신의 한수라 보거든요.
근데 QWOP 같은 게임은 경우의 수도 적어서 몬테카를로 같은건 필요없을것 같고... 결국은 튜닝과 피드백의 문제일거라고 예상이 되네요.
21/03/03 16:13
수정 아이콘
몬테카를로 탐색은 알파고 전부터 바둑ai 에선 흔히 쓰던 알고리즘입니다.
구글이 엄청난 컴퓨트를 가지고 딥러닝 스케일링과 강화학습 알고리즘 문제를 해결한게 큽니다.
태정태세비욘세
21/03/03 16:05
수정 아이콘
current status를 어떻게 읽었는지가 궁금하네요
숫자인가 화면인가..
Chasingthegoals
21/03/03 16:49
수정 아이콘
A.I도 실습하다가 샷건 쳤을 것 같은데 크크크
21/03/03 18:03
수정 아이콘
사람보다 훨씬 쉽게 잘할거 같은데... 만든사람 능력문젠듯
주파수
21/03/03 20:26
수정 아이콘
저러다가 울트론 나오는 거구나..
목록 삭게로! 맨위로
번호 제목 이름 날짜 조회
415233 [기타] 사람 바보 만드는 유튜브.jpg [7] insane10466 21/03/04 10466
415230 [유머] 김성모 월드의 75년생 주민등록증.manwha [10] 삭제됨10022 21/03/04 10022
415229 [기타] 아마존, 쇼핑몰 판매제품 복제 [6] 타카이10636 21/03/04 10636
415228 [유머] 환경을 사랑하는 회사 근황 [28] 취준공룡죠르디11722 21/03/04 11722
415227 [게임] 사이게임즈가 예전에 등록해놨던 '우마무스메'의 한국 상표권 이름들 [21] 하얀마녀10778 21/03/04 10778
415226 [유머] 유현준교수의 혜안(feat. LH) [16] 삭제됨8935 21/03/04 8935
415224 [동물&귀욤] 오징어도 인내와 보상의 개념을 이해하는걸로 밝혀져 [11] Lord Be Goja9873 21/03/04 9873
415223 [기타] 전국 임플란트 비용 공개.jpg [18] 김치찌개13181 21/03/04 13181
415222 [유머] 서울 사람이면 다 안다는 약속장소.jpg [78] 김치찌개14230 21/03/04 14230
415221 [유머] 10분 빠르게.jpg [53] 김치찌개12284 21/03/04 12284
415220 [동물&귀욤] 역시 형이야, 구하러왔구나~ [6] 그10번8453 21/03/04 8453
415219 [유머] 나는 휴대폰 케이스 쓴다 vs 그걸 왜씀 [45] 김치찌개10779 21/03/04 10779
415218 [유머] 남자들 90%는 틀리는 문제.jpg [25] 김치찌개10437 21/03/04 10437
415217 [게임] 마약 그 자체 LOL [16] 삭제됨8342 21/03/04 8342
415216 [유머] 중학생 단톡방에 잠입한 디씨인.jpg [10] Starlord9294 21/03/04 9294
415215 [동물&귀욤] [우마무스메] 극과 극을 오가는 골드 쉽 원본마의 경주 [18] 라쇼10503 21/03/04 10503
415214 [유머] 여친과 이별.. 친구들의 위로.JPG [7] 마늘빵10020 21/03/04 10020
415213 [기타] 수신료를 올리고자 하는 KBS의 한수 [6] 블랙번 록10952 21/03/04 10952
415212 [유머] 한국에 온 몽골학자 [32] 퍼블레인12264 21/03/04 12264
415211 [게임] 고인물 알피지 유저특 [13] 따라큐9940 21/03/04 9940
415210 [유머] 의외로 안전해보이는 야한 컨텐츠.JPG [22] 마늘빵13679 21/03/04 13679
415209 [기타]  유명회사 닮았다고 바뀐 로고 [8] Lord Be Goja9187 21/03/04 9187
415208 [유머] (주식) 꼴랑 한 주 들고 엄살 떠는 거 좀 추한데.. [29] 길갈14192 21/03/04 14192
목록 이전 다음
댓글

+ : 최근 1시간내에 달린 댓글
+ : 최근 2시간내에 달린 댓글
맨 위로