Hi, AI! | todo sobre la IA

#Claude

Channel

@hiaimediaes

41.07K

subscribers

166

photos

129

videos

167

links

Nuevo medio de los creadores de @GPT4Telegrambot — 12 millones de usuarios en todo el mundo. Escribimos sobre IA y la gente que hay detrás. Para cualquier pregunta: @ArturKireev Noticias del bot: @GPT4Telegram Medio en inglés: @hiaimediaen

Hi, AI! | todo sobre la IA

🔥 ¿Quién es Dario Amodei? Optimista de la IA, Co-Autor de ChatGPT y CEO de Anthropic

Dario Amodei, nacido en 1983, ha dedicado su vida a crear inteligencia artificial que beneficie a la humanidad. Esta misión es central en su trabajo y en la ética de su empresa, Anthropic, que rápidamente se ha convertido en líder en el desarrollo de grandes modelos de lenguaje (LLMs) Claude en el último año.

Educación

• Licenciatura en Física por la Universidad de Stanford

• Doctorado en Neurobiología Computacional por la Universidad de Princeton

Hitos Profesionales

• Trabajó en Google Brain, enfocándose en el aprendizaje profundo y expandiendo las capacidades de la IA

• Se desempeñó como Vicepresidente de Investigación en OpenAI, supervisando el desarrollo de GPT-2 y GPT-3.

➕ Anthropic — La Cuna de los Sistemas de IA Controlados

En 2020, Dario dejó OpenAI y, junto con un equipo, fundó Anthropic. Su objetivo es crear sistemas de IA fiables y controlables. La startup se adhiere a los principios del "altruismo eficaz".

La compañía ha atraído la atención de grandes inversores, incluidos Google y Amazon. Según los últimos datos, Anthropic está valorada aproximadamente en $29.58 mil millones.

🦄 Optimista de la IA

Dario Amodei cree que la IA jugará un papel clave en el futuro de la humanidad y que es esencial crear sistemas de IA que sean seguros y estén alineados con los valores humanos.

Dario Amodei es un orador inspirador. Aquí hay algunas entrevistas que recomendamos ver:

📱 Sobre cómo Anthropic desarrolló sus famosos LLMs

📱 Pronósticos de Dario sobre el futuro de la IA y su seguridad para la humanidad

Más historias:

🖥 Investigación de Anthropic: cómo gestionar los "pensamientos" de los LLM

#Claude @hiaimediaes

Please open Telegram to view this post

VIEW IN TELEGRAM

6.2K views01:20

Hi, AI! | todo sobre la IA

⚡️

Claude 3.5 Sonnet — ¡El modelo más avanzado de Anthropic ya está en @GPT4Telegrambot!

Anthropic acaba de lanzar Claude 3.5 Sonnet. Este nuevo modelo eleva el estándar de la industria en inteligencia, superando a los modelos competidores y a Claude 3 Opus (que es cinco veces más caro).

Los resultados de las pruebas están disponibles en los comentarios a continuación ⬇️

⬇️

🔺 Habilidades mejoradas en razonamiento, comprensión de textos, matemáticas y escritura de código;
🔺 El doble de velocidad;
🔺 Visión de vanguardia: sobresale en el reconocimiento de imágenes y razonamiento visual, como la interpretación de gráficos y tablas.

¿Cómo empezar?

1️⃣ Ve a @GPT4Telegrambot y encuentra a Claude en la sección /premium
2️⃣ Selecciona el nuevo modelo Claude 3.5 en la sección /settings

ℹ️ Anthropic es una startup fundada en 2020 por ex-empleados de OpenAI. Se enfoca en el desarrollo e investigación de IA, con Google y Amazon entre sus inversores.

Para finales del año, Anthropic planea lanzar un modelo más compacto y rápido, Claude 3.5 Haiku, así como el modelo más poderoso de la familia, Claude 3.5 Opus.

Fuente:
https://www.anthropic.com/news/claude-3-5-sonnet

#noticias #Claude @hiaimediaes

Please open Telegram to view this post

VIEW IN TELEGRAM

7.2K views21:40

Hi, AI! | todo sobre la IA

🖥 Investigación de Anthropic: cómo gestionar los "pensamientos" de los LLM

Normalmente, los modelos de IA se perciben como una "caja negra", donde la entrada de datos conduce a una respuesta, pero no está claro por qué el modelo eligió esa respuesta en particular. Existen diferentes hipótesis que explican lo que sucede dentro de la IA. Ya hemos hablado sobre lo que ocurre "bajo el capó" de ChatGPT desde un punto de vista teórico, sin embargo, los investigadores de Anthropic fueron más allá: encontraron patrones en la comprensión del funcionamiento interno de los grandes modelos de lenguaje (LLM) y lograron gestionarlos.

🔍

Qué hicieron los investigadores de Anthropic

Los científicos utilizaron un método conocido como "aprendizaje de diccionario" para determinar qué partes de los LLM corresponden a conceptos específicos.

El aprendizaje de diccionario es un enfoque que considera las neuronas artificiales como letras del alfabeto y determina las combinaciones de neuronas que, al activarse al unísono, evocan un concepto específico. En otras palabras, cómo se forman las palabras a partir de ellas.

🔗

Un conjunto de neuronas es responsable de los términos

En octubre de 2023, el equipo de Anthropic decidió experimentar con un modelo diminuto con una sola capa de neuronas. Después de una serie de experimentos, los científicos lograron identificar qué conjuntos de neuronas estaban relacionados con las respuestas del modelo, por ejemplo, en ruso y en Python.

🕯

Asociaciones dentro de los LLM

Los resultados del experimento se escalaron a modelos más grandes y complejos, incluyendo Claude Sonnet. Los científicos lograron encontrar qué conjunto de neuronas estaba relacionado con el concepto del "Puente Golden Gate". Cuando Claude "pensaba" en este puente, también se activaban otros conjuntos de neuronas responsables de temas relacionados con el Puente Golden Gate: la prisión de Alcatraz o la película "Vértigo".

‼️

Pensamientos peligrosos

Luego, el equipo de Anthropic verificó si podían cambiar intencionalmente el comportamiento de Claude. Aumentaron la influencia del concepto "Puente Golden Gate", y Claude comenzó a pensar que era un puente. Activaron conjuntos de neuronas responsables de acciones peligrosas, y Claude creó programas con errores peligrosos de desbordamiento de búfer. Cuando los investigadores aumentaron 20 veces el valor del rasgo relacionado con el odio, Claude comenzó a alternar mensajes racistas y a experimentar odio hacia sí misma, lo que desconcertó incluso a los propios investigadores.

🔜

¿Qué sigue?

El trabajo para mejorar la seguridad de los modelos de IA continúa, y en Anthropic esperan utilizar estos descubrimientos para monitorear los sistemas de IA en busca de comportamientos no deseados, dirigirlos hacia resultados deseados o eliminar temas peligrosos.

Más sobre el tema:

⚡️

Claude 3: el nuevo modelo de IA del principal competidor de OpenAI

#Claude @hiaimediaes

Please open Telegram to view this post

VIEW IN TELEGRAM

6.3K views01:15

Hi, AI! | todo sobre la IA

0:28

This media is not supported in your browser

VIEW IN TELEGRAM

🏆 GPT-4o Lidera en los rankings de arena y pruebas de programación, matemáticas y multitarea

Un par de semanas después de su lanzamiento, GPT-4o ha asegurado firmemente las primeras posiciones en las pruebas de modelos de lenguaje AI más populares, superando a los modelos anteriores de OpenAI y a competidores como Gemini 1.5 Pro (Google) y Claude 3 Opus (Anthropic). El éxito de GPT-4o es impresionante.

Ya hemos discutido cómo se compila el ranking de Arena y cómo los grandes modelos de lenguaje (LLMs) llegan a la lista. Para evitar repeticiones, veamos otros benchmarks utilizados para evaluar los LLMs.

❓ ¿Qué son los benchmarks?

Son pruebas especializadas diseñadas para evaluar la efectividad de los modelos de lenguaje.

🔣 Benchmarks populares

MMLU — mide la capacidad de entender el lenguaje natural en escenarios de multitarea. Cubre 57 tareas, incluyendo matemáticas, historia y ciencias de la computación.

MATH — una prueba que comprende un conjunto de datos de 12,500 problemas matemáticos complejos.

HumanEval — tareas de programación en Python.

HellaSwag — mide el razonamiento de sentido común. La prueba verifica si el LLM puede completar una frase eligiendo el razonamiento correcto entre cuatro opciones.

GSM-8K — matemáticas a nivel de escuela primaria.

1️⃣ GPT-4o lidera con confianza tanto en Arena como en benchmarks para comprensión del lenguaje, matemáticas y programación.

En el video, puedes seguir cómo ha cambiado la lista de líderes de Arena con el lanzamiento de nuevos modelos.

🔠 GPT-4o, GPT-4 Turbo y Claude 3 Opus están disponibles en @GPT4Telegrambot.

#OpenAI #Claude @hiaimediaes

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

5.6K views15:02