Mente profunda - DeepMind

DeepMind Technologies Limited
DeepMind logo.png
Tipo de negocio Subsidiario
Fundado 23 de septiembre de 2010 ; Hace 11 años ( 2010-09-23 )
Sede
Fundador (es)
CEO Demis Hassabis
gerente general Lila Ibrahim
Industria Inteligencia artificial
Productos AlphaGo , AlphaStar , AlphaFold , AlphaZero
Empleados > 1,000 (junio de 2020)
Padre Independiente (2010-2014)
Google Inc. (2014-2015)
Alphabet Inc. (2015-presente)
URL www.deepmind.com

DeepMind Technologies es una subsidiaria británica de inteligencia artificial de Alphabet Inc. y un laboratorio de investigación fundado en septiembre de 2010. DeepMind fue adquirida por Google en 2014. La compañía tiene su sede en Londres, con centros de investigación en Canadá, Francia y Estados Unidos. En 2015, se convirtió en una subsidiaria de propiedad total de Alphabet Inc , la empresa matriz de Google.

DeepMind ha creado una red neuronal que aprende a jugar videojuegos de una manera similar a la de los humanos, así como una máquina de Turing neuronal o una red neuronal que puede acceder a una memoria externa como una máquina de Turing convencional , lo que resulta en una computadora que imita la memoria a corto plazo del cerebro humano.

DeepMind llegó a los titulares en 2016 después de que su programa AlphaGo venciera a un jugador profesional humano de Go , Lee Sedol , el campeón mundial, en un partido de cinco juegos , que fue el tema de una película documental. Un programa más general, AlphaZero , venció a los programas más poderosos jugando al go , ajedrez y shogi (ajedrez japonés) después de unos días de jugar contra sí mismo utilizando el aprendizaje por refuerzo . En 2020, DeepMind logró avances significativos en el problema del plegamiento de proteínas .

Historia

Entrada del edificio donde se encuentran Google y DeepMind en 6 Pancras Square, Londres, Reino Unido.

La puesta en marcha fue fundada por Demis Hassabis , Shane Legg y Mustafa Suleiman en 2010. Hassabis y Legg se reunió por primera vez en la University College London 's Unidad de Neurociencia Computacional Gatsby .

Durante una de las entrevistas, Demis Hassabis dijo que la start-up comenzó a trabajar en tecnología de inteligencia artificial enseñándole a jugar juegos antiguos de los años setenta y ochenta, que son relativamente primitivos en comparación con los que están disponibles en la actualidad. Algunos de esos juegos incluyen Breakout , Pong y Space Invaders . La IA se introdujo en un juego a la vez, sin ningún conocimiento previo de sus reglas. Después de dedicar un tiempo a aprender el juego, la IA eventualmente se convertiría en una experta en él. "Se dice que los procesos cognitivos por los que atraviesa la IA son muy parecidos a los de un humano que nunca había visto el juego, que utilizaría para comprenderlo e intentar dominarlo". El objetivo de los fundadores es crear una IA de propósito general que pueda ser útil y eficaz para casi cualquier cosa.

Las principales firmas de capital de riesgo Horizons Ventures y Founders Fund invirtieron en la empresa, así como los empresarios Scott Banister, Peter Thiel y Elon Musk . Jaan Tallinn fue uno de los primeros inversores y asesor de la empresa. El 26 de enero de 2014, Google anunció que la compañía había adquirido DeepMind por $ 500 millones y que había acordado hacerse cargo de DeepMind Technologies. La venta a Google tuvo lugar después de que Facebook supuestamente terminó las negociaciones con DeepMind Technologies en 2013. Posteriormente, la compañía pasó a llamarse Google DeepMind y mantuvo ese nombre durante aproximadamente dos años.

En 2014, DeepMind recibió el premio "Compañía del año" de Cambridge Computer Laboratory .

En septiembre de 2015, DeepMind y Royal Free NHS Trust firmaron su Acuerdo de intercambio de información (ISA) inicial para desarrollar conjuntamente una aplicación de gestión de tareas clínicas, Streams.

Después de la adquisición de Google, la empresa estableció una junta de ética de inteligencia artificial . La junta de ética para la investigación de la IA sigue siendo un misterio, y tanto Google como DeepMind se negaron a revelar quién forma parte de la junta. DeepMind, junto con Amazon, Google, Facebook, IBM y Microsoft, es miembro fundador de Partnership on AI , una organización dedicada a la interfaz sociedad-AI. DeepMind ha abierto una nueva unidad llamada DeepMind Ethics and Society y se centró en las cuestiones éticas y sociales planteadas por la inteligencia artificial con el destacado filósofo Nick Bostrom como asesor. En octubre de 2017, DeepMind lanzó un nuevo equipo de investigación para investigar la ética de la IA.

En diciembre de 2019, el cofundador Suleyman anunció que dejaría DeepMind para unirse a Google, trabajando en un rol de política. En 2021, el Wall Street Journal reveló que Suleyman había sido puesto de licencia en DeepMind en 2019, luego de una investigación sobre las acusaciones de los empleados de que los había acosado. La empresa contrató a un abogado externo para investigar las acusaciones de que Suleyman había intimidado a los empleados y se le concedió una licencia antes de irse para unirse a Google. Un correo electrónico enviado al personal después de que se conoció la historia, publicado por Business Insider , dijo que "el estilo de gestión de Suleyman no cumplió con los estándares esperados".

Business Insider también publicó más detalles de las acusaciones históricas de intimidación contra Suleyman, incluidas las afirmaciones de que se jactaba de "aplastar a la gente", "tenía la costumbre de volar de la nada" y exigía que los empleados realizaran tareas no relacionadas con sus trabajos.

Productos y tecnologias

Según el sitio web de la empresa, el objetivo de DeepMind Technologies es combinar "las mejores técnicas del aprendizaje automático y la neurociencia de sistemas para construir potentes algoritmos de aprendizaje de propósito general ".

Google Research publicó un artículo en 2016 sobre la seguridad de la IA y cómo evitar comportamientos no deseados durante el proceso de aprendizaje de la IA. Deepmind también ha lanzado varias publicaciones a través de su sitio web. En 2017, DeepMind lanzó GridWorld, un banco de pruebas de código abierto para evaluar si un algoritmo aprende a deshabilitar su interruptor de apagado o exhibe ciertos comportamientos indeseables.

En julio de 2018, investigadores de DeepMind entrenaron uno de sus sistemas para jugar al juego de computadora Quake III Arena .

A partir de 2020, DeepMind ha publicado más de mil artículos, incluidos trece artículos que fueron aceptados por Nature o Science . DeepMind recibió la atención de los medios durante el período AlphaGo; Según una búsqueda de LexisNexis , 1842 historias de noticias publicadas mencionaron DeepMind en 2016, disminuyendo a 1363 en 2019.

Aprendizaje por refuerzo profundo

A diferencia de otros inhibidores de la aromatasa, tales como IBM 's Deep Blue o Watson , que fueron desarrollados para un fin pre-definida y única función dentro de su alcance, DeepMind afirmaciones de que su sistema no está preprogramado: se aprende de la experiencia, utilizando sólo píxeles sin procesar como entrada de datos. Técnicamente, utiliza el aprendizaje profundo en una red neuronal convolucional , con una forma novedosa de Q-learning , una forma de aprendizaje por refuerzo sin modelos . Prueban el sistema en videojuegos, especialmente en los primeros juegos de arcade , como Space Invaders o Breakout . Sin alterar el código, la IA comienza a entender cómo jugar, y después de un tiempo juega, para algunos juegos (sobre todo Breakout ), un juego más eficiente que cualquier humano.

En 2013, DeepMind publicó una investigación sobre un sistema de inteligencia artificial que podría superar las habilidades humanas en juegos como Pong , Breakout y Enduro , mientras superaba el rendimiento de vanguardia en Seaquest , Beamrider y Q * bert . Este trabajo supuestamente condujo a la adquisición de la empresa por parte de Google. La IA de DeepMind se había aplicado a videojuegos creados en las décadas de 1970 y 1980 ; Se estaba trabajando para juegos 3D más complejos como Quake , que apareció por primera vez en la década de 1990.

En 2020, DeepMind publicó Agent57, un agente de inteligencia artificial que supera el rendimiento a nivel humano en los 57 juegos de la suite Atari2600.

AlphaGo y sucesores

En 2014, la compañía publicó una investigación sobre los sistemas informáticos que pueden jugar Go .

En octubre de 2015, un programa informático de Go llamado AlphaGo, desarrollado por DeepMind, venció al campeón europeo de Go Fan Hui , un profesional de 2 dan (de 9 dan posibles), cinco a cero. Esta fue la primera vez que una inteligencia artificial (IA) derrotó a un jugador profesional de Go. Anteriormente, solo se sabía que las computadoras jugaban a Go a nivel "amateur". Go se considera mucho más difícil de ganar para las computadoras en comparación con otros juegos como el ajedrez , debido a la cantidad mucho mayor de posibilidades, lo que lo hace prohibitivamente difícil para los métodos tradicionales de IA como la fuerza bruta .

En marzo de 2016 venció a Lee Sedol —un jugador del 9º dan Go y uno de los jugadores mejor clasificados del mundo— con una puntuación de 4 a 1 en un partido de cinco juegos .

En la Cumbre Future of Go de 2017 , AlphaGo ganó un partido de tres juegos con Ke Jie , quien en ese momento ocupó continuamente el puesto número uno del mundo durante dos años. Usó un protocolo de aprendizaje supervisado , estudiando una gran cantidad de juegos jugados por humanos entre sí.

En 2017, una versión mejorada, AlphaGo Zero, derrotó a 0 juegos de AlphaGo 100. Las estrategias de AlphaGo Zero fueron autodidactas. AlphaGo Zero pudo vencer a su predecesor después de solo tres días con menos potencia de procesamiento que AlphaGo; en comparación, el AlphaGo original necesitó meses para aprender a jugar.

Más tarde ese año, AlphaZero, una versión modificada de AlphaGo Zero pero para manejar cualquier juego de dos jugadores con información perfecta, adquirió habilidades sobrehumanas en el ajedrez y el shogi. Al igual que AlphaGo Zero, AlphaZero aprendió únicamente a través del autojuego.

Tecnología

La tecnología AlphaGo se desarrolló sobre la base del enfoque de aprendizaje por refuerzo profundo . Esto hace que AlphaGo sea diferente del resto de tecnologías de inteligencia artificial del mercado. Dicho esto, el "cerebro" de AlphaGo fue introducido a varios movimientos basados ​​en los datos históricos del torneo. El número de movimientos se incrementó gradualmente hasta que finalmente procesó más de 30 millones de ellos. El objetivo era que el sistema imitara al jugador humano y eventualmente se volviera mejor. Jugó contra sí mismo y aprendió no solo de sus propias derrotas, sino también de sus victorias; por lo tanto, aprendió a mejorarse a sí mismo con el tiempo y, como resultado, aumentó su tasa de ganancias.

AlphaGo utilizó dos redes neuronales profundas: una red de políticas para evaluar las probabilidades de movimiento y una red de valor para evaluar las posiciones. La red de políticas se capacitó a través del aprendizaje supervisado y, posteriormente, se perfeccionó mediante el aprendizaje por refuerzo de gradiente de políticas . La red de valor aprendió a predecir los ganadores de los juegos jugados por la red de políticas contra sí misma. Después de entrenar, estas redes emplearon una búsqueda anticipada de árboles de Monte Carlo (MCTS), utilizando la red de políticas para identificar movimientos candidatos de alta probabilidad, mientras que la red de valor (junto con los despliegues de Monte Carlo utilizando una política de despliegue rápido) evaluó las posiciones del árbol.

Zero entrenó usando aprendizaje por refuerzo en el que el sistema jugó millones de juegos contra sí mismo. Su única guía fue aumentar su tasa de victorias. Lo hizo sin aprender de los juegos que jugaban los humanos. Sus únicas características de entrada son las piedras blancas y negras del tablero. Utiliza una única red neuronal, en lugar de redes de valores y políticas independientes. Su búsqueda de árbol simplificada se basa en esta red neuronal para evaluar posiciones y movimientos de muestra, sin implementaciones de Monte Carlo. Un nuevo algoritmo de aprendizaje por refuerzo incorpora la búsqueda anticipada dentro del ciclo de entrenamiento. AlphaGo Zero empleó a unas 15 personas y millones en recursos informáticos. En última instancia, necesitaba mucha menos potencia informática que AlphaGo, ejecutándose en cuatro procesadores de inteligencia artificial especializados (Google TPU ), en lugar de los 48 de AlphaGo.

AlphaFold

En 2016, DeepMind convirtió su inteligencia artificial en el plegamiento de proteínas , uno de los problemas más difíciles de la ciencia. En diciembre de 2018, AlphaFold de DeepMind ganó la decimotercera evaluación crítica de técnicas para la predicción de la estructura de proteínas (CASP) al predecir con éxito la estructura más precisa para 25 de 43 proteínas. “Este es un proyecto faro, nuestra primera gran inversión en términos de personas y recursos en un problema científico fundamental, muy importante, del mundo real”, dijo Hassabis a The Guardian . En 2020, en el 14 ° CASP, las predicciones de AlphaFold lograron una puntuación de precisión que se considera comparable con las técnicas de laboratorio. El Dr. Andriy Kryshtafovych, uno de los miembros del panel de jueces científicos, describió el logro como "verdaderamente notable" y dijo que el problema de predecir cómo se pliegan las proteínas se había "resuelto en gran medida".

WaveNet y WaveRNN

En 2016, DeepMind presentó WaveNet, un sistema de conversión de texto a voz . Originalmente, era demasiado computacionalmente intensivo para su uso en productos de consumo, pero a fines de 2017 estuvo listo para su uso en aplicaciones de consumo como el Asistente de Google . En 2018, Google lanzó un producto comercial de conversión de texto a voz, Cloud Text-to-Speech, basado en WaveNet.

En 2018, DeepMind introdujo un modelo más eficiente llamado WaveRNN co-desarrollado con Google AI . En 2019, Google comenzó a implementarlo para los usuarios de Google Duo .

AlphaStar

En 2016, Hassabis discutió el juego StarCraft como un desafío futuro, ya que requiere pensamiento estratégico y manejo de información imperfecta.

En enero de 2019, DeepMind presentó AlphaStar, un programa que juega al juego de estrategia en tiempo real StarCraft II . AlphaStar utilizó el aprendizaje por refuerzo basado en repeticiones de jugadores humanos y luego jugó contra sí mismo para mejorar sus habilidades. En el momento de la presentación, AlphaStar tenía conocimientos equivalentes a 200 años de tiempo de juego. Ganó 10 partidos consecutivos contra dos jugadores profesionales, aunque tenía la injusta ventaja de poder ver todo el campo, a diferencia de un jugador humano que tiene que mover la cámara manualmente. Una versión preliminar en la que se solucionó esa ventaja perdió un partido posterior.

En julio de 2019, AlphaStar comenzó a jugar contra humanos aleatorios en la escala pública europea multijugador 1v1. A diferencia de la primera iteración de AlphaStar, que jugó solo Protoss v. Protoss, esta jugó como todas las carreras del juego y tenía ventajas injustas corregidas. En octubre de 2019, AlphaStar alcanzó el nivel de Gran Maestro en la escala de StarCraft II en las tres carreras de StarCraft , convirtiéndose en la primera IA en llegar a la liga superior de un esport muy popular sin restricciones de juego.

Contribuciones varias a Google

Google ha declarado que los algoritmos de DeepMind han aumentado enormemente la eficiencia de enfriamiento de sus centros de datos. Además, DeepMind (junto con otros investigadores de Alphabet AI) asiste en las recomendaciones de aplicaciones personalizadas de Google Play . DeepMind también ha colaborado con el equipo de Android en Google para la creación de dos nuevas funciones que se pusieron a disposición de las personas con dispositivos que ejecutan Android Pie, la novena entrega del sistema operativo móvil de Google. Estas funciones, Adaptive Battery y Adaptive Brightness, utilizan el aprendizaje automático para ahorrar energía y hacer que los dispositivos que ejecutan el sistema operativo sean más fáciles de usar. Es la primera vez que DeepMind utiliza estas técnicas en una escala tan pequeña, con aplicaciones típicas de aprendizaje automático que requieren órdenes de magnitud más de potencia informática.

Salud DeepMind

En julio de 2016, se anunció una colaboración entre DeepMind y Moorfields Eye Hospital para desarrollar aplicaciones de inteligencia artificial para el cuidado de la salud . DeepMind se aplica al análisis de anónimos escaneo del iris, en busca de signos tempranos de enfermedades que conducen a la ceguera .

En agosto de 2016, se anunció un programa de investigación con el University College London Hospital con el objetivo de desarrollar un algoritmo que pueda diferenciar automáticamente entre tejidos sanos y cancerosos en las áreas de la cabeza y el cuello.

También hay proyectos con Royal Free London NHS Foundation Trust e Imperial College Healthcare NHS Trust para desarrollar nuevas aplicaciones móviles clínicas vinculadas a registros electrónicos de pacientes . Se informó que el personal del Royal Free Hospital dijo en diciembre de 2017 que el acceso a los datos de los pacientes a través de la aplicación había ahorrado una `` gran cantidad de tiempo '' y había marcado una diferencia `` fenomenal '' en el tratamiento de los pacientes con lesión renal aguda. Los datos de los resultados de las pruebas se envían a los teléfonos móviles del personal y les advierten de los cambios en la condición del paciente. También permite al personal ver si alguien más ha respondido y mostrar a los pacientes sus resultados en forma visual.

En noviembre de 2017, DeepMind anunció una asociación de investigación con el Centro de Investigación del Cáncer del Reino Unido en el Imperial College de Londres con el objetivo de mejorar la detección del cáncer de mama mediante la aplicación del aprendizaje automático a la mamografía. Además, en febrero de 2018, DeepMind anunció que estaba trabajando con el Departamento de Asuntos de Veteranos de EE. UU. En un intento de utilizar el aprendizaje automático para predecir la aparición de una lesión renal aguda en los pacientes y, de manera más general, el deterioro general de los pacientes durante una estadía en el hospital, por lo que que los médicos y enfermeras puedan tratar más rápidamente a los pacientes que lo necesiten.

DeepMind desarrolló una aplicación llamada Streams, que envía alertas a los médicos sobre pacientes en riesgo de sufrir lesiones de riesgo agudo. El 13 de noviembre de 2018, DeepMind anunció que su división de salud y la aplicación Streams serían absorbidas por Google Health . Los defensores de la privacidad dijeron que el anuncio traicionaba la confianza del paciente y parecía contradecir declaraciones anteriores de DeepMind de que los datos del paciente no se conectarían a cuentas o servicios de Google. Un portavoz de DeepMind dijo que los datos de los pacientes se mantendrían separados de los servicios o proyectos de Google.

Controversia del intercambio de datos del NHS

En abril de 2016, New Scientist obtuvo una copia de un acuerdo de intercambio de datos entre DeepMind y Royal Free London NHS Foundation Trust . Este último opera tres hospitales de Londres donde se trata anualmente a aproximadamente 1,6 millones de pacientes. El acuerdo muestra que DeepMind Health tuvo acceso a admisiones, alta y transferencia de datos, accidentes y emergencias, patología y radiología y cuidados críticos en estos hospitales. Esto incluyó detalles personales como si las pacientes habían sido diagnosticadas con VIH , sufrían depresión o alguna vez se habían sometido a un aborto para realizar investigaciones para buscar mejores resultados en diversas condiciones de salud.

Se presentó una denuncia ante la Oficina del Comisionado de Información (ICO), argumentando que los datos deberían estar seudonimizados y encriptados. En mayo de 2016, New Scientist publicó otro artículo en el que afirmaba que el proyecto no había obtenido la aprobación del Grupo Asesor de Confidencialidad de la Agencia Reguladora de Medicamentos y Productos Sanitarios .

En mayo de 2017, Sky News publicó una carta filtrada de la Guardiana Nacional de Datos, Dame Fiona Caldicott , revelando que, en su "opinión considerada", el acuerdo de intercambio de datos entre DeepMind y Royal Free se llevó a cabo sobre una "base legal inapropiada". La Oficina del Comisionado de Información dictaminó en julio de 2017 que el hospital Royal Free no cumplió con la Ley de Protección de Datos cuando entregó los datos personales de 1,6 millones de pacientes a DeepMind.

Sociedad y ética de DeepMind

En octubre de 2017, DeepMind anunció una nueva unidad de investigación, DeepMind Ethics & Society. Su objetivo es financiar investigaciones externas sobre los siguientes temas: privacidad, transparencia y equidad; impactos económicos; gobernanza y rendición de cuentas; gestionar el riesgo de IA; Moralidad y valores de la IA; y cómo la IA puede abordar los desafíos del mundo. Como resultado, el equipo espera comprender mejor las implicaciones éticas de la IA y ayudar a la sociedad a ver que la IA puede ser beneficiosa.

Esta nueva subdivisión de DeepMind es una unidad completamente separada de la asociación de empresas líderes que utilizan inteligencia artificial, academia, organizaciones de la sociedad civil y organizaciones sin fines de lucro con el nombre Partnership on Artificial Intelligence to Benefit People and Society de la que DeepMind también forma parte. La junta de ética y sociedad de DeepMind también es distinta de la junta de ética de inteligencia artificial que Google acordó formar originalmente al adquirir DeepMind.

Profesores DeepMind de aprendizaje automático

DeepMind patrocina tres cátedras de aprendizaje automático:

  1. uno en la Universidad de Cambridge , a cargo de Neil Lawrence , en el Departamento de Ciencia y Tecnología de la Computación
  2. otro en la Universidad de Oxford , a cargo de Phil Blunsom . en el Departamento de Ciencias de la Computación
  3. otro en el University College London , a cargo de Marc Deisenroth . en el departamento de Ciencias de la Computación de la Facultad de Ciencias de la Ingeniería

Ver también

Referencias

enlaces externos