Douze jours dans le tournoi de poker le plus étrange de leur vie, Jason : Comment les ordinateurs ont finalement été en mesure de mieux poker pros ; Les et ses compagnons sont retournés à leur hôtel, battus et épuisés. Accrochés sur une pile de tacos, ils élaborèrent une stratégie, comme ils l'avaient fait tous les soirs. Avec environ 60 000 mains jouées et 60 000 à faire, elles perdaient mal à un adversaire inhabituel: un programme informatique appelé Libratus, qui a gagné près de 800 000 $ en jetons. Ce n'était pas censé se produire. En 2015, Les et une équipe de pros du poker ont battu un programme informatique similaire, gagnant environ 700 000 $ :
C'est parce que contrairement aux dames et aux échecs, où toutes les pièces sont visibles, le poker est un jeu de connaissances limitées et d'incertitude, de cartes cachées et de bluffs. Il est peut-être plus vrai à la vie, ce qui peut expliquer pourquoi il a été difficile pour les puces de silicium de saisir.
"AI a eu beaucoup de problèmes avec le poker", a déclaré Noam Brown, un étudiant diplômé de l'Université Carnegie Mellon qui a développé Libratus avec l'informatique CMU Tuomas Sandholm. "C'est le saint graal des jeux d'information imparfaits."
Une victoire pour Libratus, a déclaré Brown, ne serait pas une grande menace pour les joueurs de poker humains. Son cerveau est un supercalculateur qui coûte des millions de dollars par an à courir, donc l'utiliser pour jouer au poker ne serait pas un excellent moyen de gagner de l'argent. Mais Libratus pourrait être un pas vers l'aide à l'intelligence artificielle traitant plus largement de l'incertitude.
C'est parce que le poker n'est pas simplement un jeu de hasard. Il ne nécessite pas non plus de pouvoir lire les expressions faciales d'un adversaire, bien que Hollywood pourrait nous faire croire autrement. Ce qui guide les décisions de Libratus est de puissantes mathématiques, mathématiques qui pourraient être appliquées aux enchères, aux négociations, aux finances, à la sécurité et à d'autres arènes du monde réel où l'information est cachée.
Les mathématiciens sérieux ont longtemps été fascinés par le poker. John von Neumann, un pionnier de la théorie des jeux, la branche des mathématiques qui traite de la concurrence, a exploré les tenants et les aboutissants du jeu de cartes au début du siècle dernier. En 1950, Nash a publié un article montrant qu'il ya une meilleure stratégie pour de nombreux jeux, y compris le poker en tête-à-un, indépendamment de la façon dont votre adversaire L'adversaire joue. Cette stratégie, maintenant appelée équilibre de Nash, peut ne pas toujours gagner, mais elle fait mieux que toute autre approche.
Trouver l'équilibre de Nash pour des jeux simples tels que tic-tac-orteil ou roche, papier, ciseaux est facile. Le trouver pour un jeu aussi compliqué que le poker est difficile. Une intelligence artificielle développée à l'Université de l'Alberta a été en mesure de maîtriser une version de base de poker appelé heads-up limite Texas Hold'em, dans lequel deux joueurs rivalisent les uns contre les autres avec une capacité restreinte de parier. Mais une main de no-limit heads-up poker, dans laquelle les joueurs peuvent miser autant qu'ils le veulent, implique un grand nombre de possibilités: 10 à la puissance de 160, qui est un suivi de 160 zéros. C'est plus que le nombre estimé d'atomes dans l'univers. Pour les jeux de poker impliquant plus de deux personnes, les possibilités deviennent incalculables.
Des gens allant des universitaires aux retraités enthousiastes ont essayé de créer des intelligences artificielles pour simplifier le problème. Tous les mois de février, ils font leurs créations les uns contre les autres lors d'une compétition réservée aux machines. Un gagnant est déclaré, mais une personne qui a simplement plié chaque main ferait mieux que beaucoup de ces IA. «Chaque année, les ordinateurs jouent des milliards de mains les uns contre les autres», explique Jonathan Schaeffer, un informaticien de l'Université de l'Alberta qui a aidé à lancer le concours. "Chaque année, nous voyons une amélioration progressive."
Mis à part les gens derrière Carnegie Mellon's Libratus, seule l'équipe de l'Alberta a fait la prétention d'être capable de battre les humains. Le programme canadien, appelé DeepStack, utilise un réseau de neurones, un logiciel qui fonctionne un peu comme le cerveau humain, faisant des estimations rapides que ses créateurs de comparer à une intuition et reconsidérer ses options que de nouvelles cartes sont posées sur la table. Un article de recherche publié le 10 janvier affirme que DeepStack a joué 40 000 mains contre des dizaines de joueurs de poker et a gagné, devenant ainsi le «premier programme informatique à battre les joueurs de poker professionnels dans le heads- up sans limite. Cette fois, les pros avaient initialement maintenu les choses plus ou moins même en trouvant des failles dans la façon dont l'ordinateur a joué; Fans suivant ce "Brains vs. AI "à la Rivers Casino ici mettre les chances de l'AI gagner à seulement environ 1 sur 4.
Mais à la deuxième semaine, les défauts avaient disparu; Les chances de l'ordinateur triomphant augmenté. "Le jour 1, il avait bien joué, mais ce n'était pas impressionnant," dit Les. "Ce qui est impressionnant, c'est comment cette chose a appris et évolué, combien mieux il a obtenu tous les jours."
Les machines ont appris beaucoup sur la façon de jouer à des jeux. Il ya 20 ans, ils ont découvert des dames, et il ya 10 ans.........
"AI a eu beaucoup de problèmes avec le poker", a déclaré Noam Brown, un étudiant diplômé de l'Université Carnegie Mellon qui a développé Libratus avec l'informatique CMU Tuomas Sandholm. "C'est le saint graal des jeux d'information imparfaits."
Une victoire pour Libratus, a déclaré Brown, ne serait pas une grande menace pour les joueurs de poker humains. Son cerveau est un supercalculateur qui coûte des millions de dollars par an à courir, donc l'utiliser pour jouer au poker ne serait pas un excellent moyen de gagner de l'argent. Mais Libratus pourrait être un pas vers l'aide à l'intelligence artificielle traitant plus largement de l'incertitude.
C'est parce que le poker n'est pas simplement un jeu de hasard. Il ne nécessite pas non plus de pouvoir lire les expressions faciales d'un adversaire, bien que Hollywood pourrait nous faire croire autrement. Ce qui guide les décisions de Libratus est de puissantes mathématiques, mathématiques qui pourraient être appliquées aux enchères, aux négociations, aux finances, à la sécurité et à d'autres arènes du monde réel où l'information est cachée.
Les mathématiciens sérieux ont longtemps été fascinés par le poker. John von Neumann, un pionnier de la théorie des jeux, la branche des mathématiques qui traite de la concurrence, a exploré les tenants et les aboutissants du jeu de cartes au début du siècle dernier. En 1950, Nash a publié un article montrant qu'il ya une meilleure stratégie pour de nombreux jeux, y compris le poker en tête-à-un, indépendamment de la façon dont votre adversaire L'adversaire joue. Cette stratégie, maintenant appelée équilibre de Nash, peut ne pas toujours gagner, mais elle fait mieux que toute autre approche.
Trouver l'équilibre de Nash pour des jeux simples tels que tic-tac-orteil ou roche, papier, ciseaux est facile. Le trouver pour un jeu aussi compliqué que le poker est difficile. Une intelligence artificielle développée à l'Université de l'Alberta a été en mesure de maîtriser une version de base de poker appelé heads-up limite Texas Hold'em, dans lequel deux joueurs rivalisent les uns contre les autres avec une capacité restreinte de parier. Mais une main de no-limit heads-up poker, dans laquelle les joueurs peuvent miser autant qu'ils le veulent, implique un grand nombre de possibilités: 10 à la puissance de 160, qui est un suivi de 160 zéros. C'est plus que le nombre estimé d'atomes dans l'univers. Pour les jeux de poker impliquant plus de deux personnes, les possibilités deviennent incalculables.
Des gens allant des universitaires aux retraités enthousiastes ont essayé de créer des intelligences artificielles pour simplifier le problème. Tous les mois de février, ils font leurs créations les uns contre les autres lors d'une compétition réservée aux machines. Un gagnant est déclaré, mais une personne qui a simplement plié chaque main ferait mieux que beaucoup de ces IA. «Chaque année, les ordinateurs jouent des milliards de mains les uns contre les autres», explique Jonathan Schaeffer, un informaticien de l'Université de l'Alberta qui a aidé à lancer le concours. "Chaque année, nous voyons une amélioration progressive."
Mis à part les gens derrière Carnegie Mellon's Libratus, seule l'équipe de l'Alberta a fait la prétention d'être capable de battre les humains. Le programme canadien, appelé DeepStack, utilise un réseau de neurones, un logiciel qui fonctionne un peu comme le cerveau humain, faisant des estimations rapides que ses créateurs de comparer à une intuition et reconsidérer ses options que de nouvelles cartes sont posées sur la table. Un article de recherche publié le 10 janvier affirme que DeepStack a joué 40 000 mains contre des dizaines de joueurs de poker et a gagné, devenant ainsi le «premier programme informatique à battre les joueurs de poker professionnels dans le heads- up sans limite. Cette fois, les pros avaient initialement maintenu les choses plus ou moins même en trouvant des failles dans la façon dont l'ordinateur a joué; Fans suivant ce "Brains vs. AI "à la Rivers Casino ici mettre les chances de l'AI gagner à seulement environ 1 sur 4.
Mais à la deuxième semaine, les défauts avaient disparu; Les chances de l'ordinateur triomphant augmenté. "Le jour 1, il avait bien joué, mais ce n'était pas impressionnant," dit Les. "Ce qui est impressionnant, c'est comment cette chose a appris et évolué, combien mieux il a obtenu tous les jours."
Les machines ont appris beaucoup sur la façon de jouer à des jeux. Il ya 20 ans, ils ont découvert des dames, et il ya 10 ans.........
Commentaires