11 Feb 2026 · Original en inglés · Resumen IA

GPT 've': IA de código abierto 've' imágenes con Google Lens

Fuentes: Show HN: I taught GPT-OSS-120B to see using Google Lens and OpenCV

Un desarrollador ha creado una herramienta llamada 'noapi-google-search-mcp' que permite a modelos de lenguaje grandes (LLM) de código abierto, como GPT-OSS-120B, acceder a capacidades de visión y búsqueda en internet sin necesidad de claves de API. El proyecto, anunciado en Hacker News, integra Google Lens y OpenCV para identificar objetos en imágenes, permitiendo que modelos originalmente diseñados solo para texto, como GPT-OSS-120B, puedan 'ver' y reconocer elementos visuales. En una demostración, el modelo identificó correctamente un NVIDIA DGX Spark y un dispositivo de almacenamiento SanDisk a partir de una fotografía de un escritorio. Además de la funcionalidad de visión, la herramienta proporciona acceso a una amplia gama de servicios de Google, incluyendo búsqueda, noticias, compras, mapas, traducción y más, en total 17 herramientas. La instalación se realiza a través de comandos simples de Python (pip install noapi-google-search-mcp && playwright install chromium) y el código

Temas

ia desarrollo empresas

Etiquetas

gpt-oss-120b google-lens opencv llm inteligencia-artificial codigo-abierto vision-artificial google desarrollo-software hacker-news

Entidades mencionadas

pip software

VincentKaufmann person

Vincent Kaufmann (born 1969 in Geneva) is a Swiss sociologist specialized in mobility studies and urban sociology. He is a professor of sociology at EPFL (École Polytechnique Fédérale de Lausanne) and

Google organization

Google LLC es una empresa de tecnología multinacional con sede en California, Estados Unidos, que se centra en inteligencia artificial, publicidad en línea, tecnología de motores de búsqueda, computac

Ver en Wikipedia

Chromium software