FAQ para Red Hat AI InstructLab

Consulte las siguientes preguntas más frecuentes en InstructLab. Para consultar todas las preguntas más frecuentes sobre IBM Cloud®, visite nuestra página Biblioteca preguntas más frecuentes.

¿Qué es InstructLab?

InstructLab es una solución de IA generativa privada y segura impulsada por Red Hat Enterprise Linux AI, disponible en IBM Cloud. Permite a los usuarios conservar la propiedad de sus datos y modelos, aprovechar datos empresariales únicos para la innovación y minimizar el riesgo de olvidos catastróficos.

¿Por qué debería utilizar InstructLab para mi solución de IA generativa?

InstructLab ofrece varias ventajas para su solución de IA generativa. En primer lugar, le permite conservar la propiedad tanto de los datos como del modelo, lo que le da el control sobre cómo se utilizan sus datos y cómo funciona su modelo. En segundo lugar, le permite aprovechar datos empresariales únicos para desbloquear eficiencias e impulsar la innovación mediante la creación de soluciones impulsadas por IA. En tercer lugar, minimiza el riesgo de olvido catastrófico al utilizar modelos integrados en Granite como base para el aprendizaje de nuevas habilidades y conocimientos. En cuarto lugar, está disponible como servicio en IBM Cloud, lo que le permite reducir costes innecesarios pagando sólo por lo que necesita y optimizar los gastos de TI mediante modelos más sencillos, rápidos y económicos.

¿Cuáles son las ventajas de InstructLab en IBM Cloud?

InstructLab en IBM Cloud ofrece varias ventajas, entre ellas

Propiedad de los datos: Los usuarios conservan la propiedad tanto de los datos como del modelo, lo que les permite controlar sus datos y su modelo.
Aprovechamiento de datos empresariales únicos: Los usuarios pueden aumentar la eficiencia e impulsar la innovación creando soluciones basadas en IA a partir de sus datos empresariales exclusivos.
Minimizar el riesgo de olvido catastrófico: InstructLab utiliza los modelos de Granite como base para el aprendizaje de nuevas habilidades y conocimientos, minimizando el riesgo de perder la información previamente aprendida al aprender nueva información.
Seguro, actualizado y disponible: InstructLab está disponible como servicio en IBM Cloud, lo que permite a los usuarios reducir costes innecesarios y optimizar el gasto en TI.
Portabilidad de los datos: Los usuarios pueden exportar su contenido y configuración a otras infraestructuras.
Infraestructura de nube de nivel empresarial: InstructLab utiliza la sólida y segura infraestructura de IBM Cloud, diseñada para satisfacer los estrictos requisitos de las cargas de trabajo críticas para la empresa.
Flexibilidad: InstructLab ofrece acceso a una amplia variedad de perfiles de hardware, aceleradores informáticos VMware y la posibilidad de ampliar la capacidad en cuestión de horas.
Servicios avanzados en la nube: IBM Cloud proporciona acceso a las últimas GPU y a los servicios IBM watsonx gen AI, inferencing y machine learning para acelerar la innovación en los procesos de negocio.

¿Qué son los modelos Granite?

Estos modelos multimodales, preparados para la empresa y de código abierto, ofrecen un rendimiento excepcional con respecto a las referencias de seguridad y en una amplia gama de tareas empresariales, desde la ciberseguridad hasta la GAR.

¿Qué modelo de Granite utiliza InstructLab?

InstructLab utiliza el modelo granite-3.1-8b-starter-v2.1.

¿Qué es una taxonomía?

Una taxonomía es un directorio de archivos que contiene los datos que se introducen en el modelo. Se organiza en una estructura en cascada en la que cada subdirectorio, o "rama", del "árbol" de la taxonomía termina con un "nodo hoja", que es un conjunto de archivos que contienen los datos pertinentes. Puede contribuir a una taxonomía añadiendo una "rama" completamente nueva, o añadiendo nuevos datos a un archivo qna.yaml ya existente. Para más información sobre la estructura de las taxonomías, consulte Cómo se estructuran las taxonomías en InstructLab. También puede consultar la taxonomía InstructLab en GitHub.

¿Cómo funciona la validación de taxonomías?

Al cargar una taxonomía en InstructLab, se realizan las comprobaciones:

Validar el formato y la sintaxis de sus archivos qna.yaml utilizando el comando ilab diff.
Intentar clonar los documentos de conocimientos y competencias a los que se hace referencia en sus archivos qna.yaml.
Comprobación de que dispone de las autorizaciones de servicio correctas, por ejemplo para Object Storage y Secrets Manager.

¿Cómo funciona la facturación?

Los costes se generan por el uso tanto de Red Hat AI InstructLab como del IBM Cloud® Object Storage que se utiliza como lugar de almacenamiento.

Si opta por implantar el modelo en otro servicio, también puede incurrir en gastos adicionales.

¿Cómo se calcula el coste en Red Hat AI InstructLab?

El coste del uso de Red Hat AI InstructLab se basa en dos métricas que se miden en tokens. Cada ficha corresponde a una cantidad específica de potencia de cálculo necesaria para las tareas de procesamiento. El número total de fichas consumidas influye directamente en la escala de generación de datos o de ajuste del modelo. Esta métrica sirve de base a nuestro sistema de facturación, que permite a los usuarios supervisar y controlar sus costes en función de los recursos informáticos utilizados. Los tokens que se procesan para la Generación de Datos Sintéticos (SDG) y la Alineación de Modelos se facturan por separado.

Generación de datos sintéticos (SDG): Los tokens de salida (SYN-DATA-TOKEN) se calculan por el volumen de datos generados producidos por el servicio a partir de toda la taxonomía de entrada. El texto se tokeniza utilizando la biblioteca tokenizer de Hugging Face con la información de tokenización para el modelo de profesor Mistral.
Formación en alineación de modelos: Los tokens de entrada (MODEL-TRAIN-TOKEN) se calculan en función de la cantidad de datos introducidos en el sistema para el entrenamiento de alineación del modelo, así como el conocimiento de base Granite que se utiliza para aumentar la precisión sin pérdida de conocimiento. Debido a los conocimientos básicos que se utilizan, el coste es mínimo.

¿Cómo puedo encontrar y seguir la información sobre costes a medida que avanzo?

Antes de empezar a ejecutar cualquier cosa en Red Hat AI InstructLab, puede utilizar el estimador de costes para obtener una estimación de lo que podría costar.
Cargue su taxonomía
Cuando establezca los detalles para la generación de datos, revise el coste estimado antes de iniciar el trabajo.
Una vez generados los datos, también puede ver los tokens de salida estimados en los detalles de esa generación de datos.
Cuando establezca los detalles del trabajo de formación, revise el coste estimado antes de iniciar el trabajo.
Una vez finalizados los trabajos, puede revisar los costes reales en Facturación y uso. Puede consultar los costes tanto de Red Hat AI InstructLab como del IBM Cloud® Object Storage que se utiliza como almacén.

¿Se facturan las operaciones fallidas?

Las operaciones fallidas no se facturan. Las operaciones realizadas con éxito y las canceladas por el usuario se facturan, aunque las canceladas por el usuario se prorratean en función del tratamiento realizado.

¿Qué es la generación de datos?

La generación de datos es el proceso de generar preguntas y respuestas basadas en las preguntas y respuestas que usted incluyó en los archivos QNA.

¿Qué es la formación de modelos?

La formación es el proceso de aprendizaje de las preguntas y respuestas. La formación comienza con conocimientos y técnicas básicas, para pasar después a las técnicas de composición.

¿Cuánto tarda en funcionar?

Tanto la generación de datos como el entrenamiento del modelo requieren mucho tiempo. Puede encontrar estimaciones generales en la consola al iniciar los procesos.

Factores que influyen en el tiempo de finalización:

El contenido de los documentos de conocimiento
El número de otros trabajos en la cola

¿Cuánto dura la generación de datos?

Tras la puesta en cola, la generación de datos suele tardar entre 2 y 6 horas en ejecutarse. Para hacer una estimación, la fórmula general es tomar el número de fichas de salida, dividirlo por unas 5000 fichas por segundo, dividirlo por 60 segundos por minuto y dividirlo por 60 minutos en una hora.

Tokens / 5000 / 60 / 60 = Number of hours

¿Cuánto dura la formación de modelos?

Para el entrenamiento del modelo, la fórmula general es tomar el número de tokens de salida, dividido por unos 4000 tokens por segundo, dividido por 60 segundos por minuto, y dividido por 60 minutos en una hora.

Tokens / 4000 / 60 / 60 = Number of hours

¿Puedo importar mis propios datos de entrenamiento?

Sí, puede importar sus propios datos de entrenamiento. Importar sus propios datos de formación es beneficioso para una variedad de casos de uso y puede ayudarle a optimizar el rendimiento y la eficiencia en entornos híbridos.

Adapte los modelos de formación a sus necesidades específicas y mantenga el control sobre sus fuentes de datos, ya sean locales o en IBM Cloud.
Generación de datos en trozos más pequeños y manejables, para evitar tiempos de espera o límites del sistema. Posteriormente, puede combinar estos conjuntos de datos más pequeños en un único conjunto de datos para el entrenamiento.
Combinar datos de entrenamiento generados previamente con datos nuevos, de modo que pueda volver a entrenar de forma iterativa los modelos tanto con los conocimientos existentes como con los recién adquiridos.

Otros casos de uso:

Importe uno o varios documentos de conocimientos y competencias al generar los datos.
Combine varias series de datos de entrenamiento en una sola.
Genere datos, descárguelos, manipule una subsección de sus datos y vuelva a generarlos.
Combine los datos generados previamente con los nuevos datos importados.
Importe datos, genere datos de entrenamiento y, a continuación, combine esos datos con otra ejecución de generación de datos.
Combine el búfer de repetición y los datos importados de su taxonomía. Esta función sólo está disponible a través de la API o la CLI.
Importe datos y genere datos de formación a partir de su taxonomía. Esta función sólo está disponible a través de la API o la CLI.