딥마인드, 아타리 57개 모든 게임 인간추월 성과 > IT/컴퓨터

본문 바로가기




IT/컴퓨터

딥마인드, 아타리 57개 모든 게임 인간추월 성과

페이지 정보

작성자 익명 작성일20-04-03 17:42 조회1,545회 댓글0건

본문

아타리의 비디오게임 솔라리스 핏폴(함정).

https://news.v.daum.net/v/20200403151603540

알파고의 전신인 DQN 2014년 49개중 29개에서 인간 능가
범용적 게임학습능력 갖췄지만 "2개 이상 게임 동시학습 불가"
어린 아이도 갖고 있는 인간의 유연함이 인공지능시대 구별점

딥마인드의 아드리아 바이다 등 연구진은 논문공유 사이트 아카이브(arXiv.org)에 지난달 30일 논문(Agent57: Outperforming the Atari Human Benchmark)을 공개하고 자사가 개발한 인공지능 에이전트57의 성과를 알렸다.

에이전트57은 딥마인드가 2012년 개발해 2015년 2월 <네이처>에 처음 공개한 심화신경망 방식의 강화학습 인공지능 DQN(Deep-Q Network)의 연장선 상에 있는 강화학습 방식의 인공지능이다. 이를 활용해 개발한 바둑인공지능 알파고가 2016년 1월 <네이처>에 공개됐고, 이후 알파스타(스타크래프트용 인공지능), 알파제로 등으로 적용 범위를 확대한 인공지능의 개발로 이어졌다. 딥마인드가 2014년 처음 DQN의 강화학습 모델을 <네이처>에 공개했을 당시, DQN은 아타리 비디오게임 49개 종목을 대상으로 학습을 했다. DQN은 49개 게임 중에서 널리 알려진 벽돌깨기(Breakout)을 포함한 29개 게임에서 사람의 평균기록보다 높은 점수에 도달했다. 이번에 에이전트57은 아타리 비디오게임의 모든 종목을 사람 최고수 수준으로 마스터했지만, 여전히 범용 인공지능은 먼 목표다.


구글이 바둑 알파고에 멈추지 않고 이제 아타리 게임에도 AI학습을 적용해보네요. 사실 실재 세계의 단순화된 모델을 게임으로 생각하면, 실재 세계에 적용하기 전에 자꾸 게임을 학습시켜서 시뮬레이션 돌리는 게 아닌가 싶습니다. 실전에 쓰이면 AI가 택배를 나르거나, 차를 운전하거나, 음성을 알아듣고 번역을 하거나 하는 것이죠. 딥마인드가 이거해서 구글에 거액에 팔렸고 그 후에 한게 알파고죠 크

손도 한번 못대고 털린다가 뭔지 경험하실 수 있을거라 장담합니다(...)
하이퍼 스트리터 파이터 2만 해도 벽을 느낄 수 있는데 심리전이 극대화된 딥마인드면;;

실제로 팀밀리 2:2 방식으로 아프리카에서 프로게이머들이 종족간 전투 해봤는데 테란이 저그 뮤탈 못 막고 토스는 당연히 저그에게 안되어서 저그가 최강 먹었던 기억이 나네요 ㅋㅋ 컨트롤이 정교해질수록 저그가 더 버프를 받는 듯 합니다.

알파고가 바둑의 새로운 기보를 제시했듯이
스타에 있어서도 그런 일이 있을 수 있지 않을까요? 모든것을 극한으로 활용한다면 우리가 일반적으로 알던 종족상성이 실제로는 전혀 다를 수도 있고..ㅋㅋㅋ

apm이 분당 명령수(?맞나요)인데.. 똑같은 명령수라도 그 명령의 질이 인간과 확연히 차이나서.. 뮤탈 3부대가 와서 짤짤이 하는데 베슬로 이레디에잇 걸어도 그 뮤탈만 바로 쏵 빼는 컨트롤이 가능하다면 테란은 저그를 못 이기는 거 아닙니까 -.-

ㅗㅜㅑ.. 뮤탈 3부대 짤짤이에다가 이레딧 걸면 바로 분리시키는 컨트롤에.. 스톰 뿌리면 바로회피.. 너무 극혐 아닙니까
컴까기할때도 기본탑재된AI 얘네 스킬쓰는건 진짜 짜증나죽는줄알았는데

그때도 apm제한은 걸었어요. 그런데 eapm제한을 걸은 것 같진 않아요. 그리고 똑같은 apm이라도 인간은 3부대 뮤탈리스크 산개 컨트롤을 못하는데 컴퓨터는 할 수 있죠(..) 컴퓨터 저그는 그냥 뮤탈 올인 빌드만 갈고 닦으면 인간이 못막을듯 합니다.

그래서 apm제한걸고 한다는 이야기를 들은것같은데..컴퓨터가 최적화시킨 빌드와 운영은 과연 어떤 모습일까요

저번에 스2 가지고 손을 좀 대다가 말은 것 같아요. AI가 인간을 이기긴 이겼는데 전략적인 고등적 사고로 이긴 게 아니라 화려한 유닛 컨트롤로 이겼기 때문에 무효..

스타크래프트는 안하나요?

킹오파 한번 붙어보고 싶네요.
질거같으면 의자 한방이면 일발역전..

원래 이쪽이 알파고보다 먼저였습니다

http://www.bbc.com/news/world-europe-43003740

Russian security officers have arrested several scientists working at a top-secret Russian nuclear warhead facility for allegedly mining crypto-currencies

러시아 비밀 핵시설에서 과학자들이 채굴돌리다가 걸려서 잡혀갔다는 소식입니다.

?! 저 동네는 굴라그....

영창 가즈아~~~

http://view.asiae.co.kr/news/view.htm?idxno=2018090718473111889

저도 쓰자말자 불편하던데 기사 많이 있네요 아직 적응단계인거같아요

역시, 모든 사업은 물 들어올 때 노 것는 것이고...
조만간 맨 윗선은 손 떼고 넘기겠네요.

다음 지도도요.

엠엔톡 마이피플 문닫은 이후 경쟁자라고 불릴만한 메신져들이 없지요
텔레그램이나 라인이 있지만 점유율 한자리수구요

진정한 위협은 누군가가 카톡 라이트버전 만드는게 아닐까 싶습니다 ㅎ

다음팟플을 카카오팟플로바꿀떄도 말아먹더니 아주 ㅋㅋㅋㅋ

저만 못 찾는 게 아니었겠군요. ㅡㅡ

전 카톡을 거의 안써서 몰랐는데...많이 바뀌었나보군요

수익성증진과 속도향상사이 갈림길이네요. 이러다가 새로운 경쟁자가 나오면 밀리는거 아닌가

http://m.ddaily.co.kr/m/m_article.html?no=168513

저작권보호냐, 기본권 침해냐… 도마 오른 ‘https 차단


반년전 기사이지만, 이번 차단 방법이 잘 나와있어서 가져와봤습니다.

기사에 의하면 SNI기반 차단 방식은 헤더의 SNI필드만 보고, 페이로드까지 보는건 아니라고 합니다. 법은 잘 모르지만, 페이로드를 복호하지 않는다면 통신비밀보호법을 위반하는건 아니라고 알고 있습니다. 헤더 == 주소,이름 등 부가정보. 페이로드 == 내용 이라서요.

그리고 SNI필드도 암호화 예정이기 때문에 다음 https 버전 부터는 현재의 방식은 무용지물이 될 예정이라고 합니다.
==>>

ESNI (SNI필드 암호화)는 현재 early stage 라고 합니다. 스펙을 보고 수정합니다.

https://tools.ietf.org/html/draft-rescorla-tls-esni-00 마음만 먹으면 어떤 정당이든 정권을 잡으면 악용이 가능한거라서...
이건에 관련해서 문가놈이 까여도 할말이 없습니다.
더구나 내로남불도 하고있고
https://news.naver.com/main/read.nhn?mode=LSD&mid=sec&sid1=001&oid=092&aid=0002010258

각 커뮤니티에서 야동으로 프레임이 잡히는 경우가 많은데
이러면 정부가 역공하기가 매우 쉬워집니다. 아니 정부가 바라고 있을겁니다.
지금 괜히 리벤지 포르노로 약을 쳐놓게 아닌데 그걸 물어버리는 상황이 되니까요...
하여간 뇌가 X에 있는 사람들때문에...

이게 뭔가 하고 봤더니 어처구니가...

테러도 못해낸 일을 야동이 해내는군요.

주소, 이름 만으로도 충분히 사생활 침해가 될텐데 ㅎㅎ

불법 저작물 공유 사이트를 제한하는게 목적이라면 더 직접적이고 현행법 테두리 내에서 가능한 방법이 있는데도 반발 무시하고 강행하는건 그저 변명이라고만 생각됩니다. 자꾸만 실망 안겨다주는 정책들에서 투표 잘 했나? 의문이 늘어만 갑니다.

방식이 잘못됐죠
뭐가 됐든 까보는 건 잘못된 거에요

저작권보호도 중요하지만 일단 헌법은 벗어나지 말아야하지않나...

댓글목록

등록된 댓글이 없습니다.

IT/컴퓨터