Un desarrollador ha creado una herramienta llamada 'noapi-google-search-mcp' que permite a modelos de lenguaje grandes (LLM) de código abierto, como GPT-OSS-120B, acceder a capacidades de visión y búsqueda en internet sin necesidad de claves de API. El proyecto, anunciado en Hacker News, integra Google Lens y OpenCV para identificar objetos en imágenes, permitiendo que modelos originalmente diseñados solo para texto, como GPT-OSS-120B, puedan 'ver' y reconocer elementos visuales. En una demostración, el modelo identificó correctamente un NVIDIA DGX Spark y un dispositivo de almacenamiento SanDisk a partir de una fotografía de un escritorio. Además de la funcionalidad de visión, la herramienta proporciona acceso a una amplia gama de servicios de Google, incluyendo búsqueda, noticias, compras, mapas, traducción y más, en total 17 herramientas. La instalación se realiza a través de comandos simples de Python (pip install noapi-google-search-mcp && playwright install chromium) y el código
