Come sono strutturate le tassonomie per InstructLab

Una tassonomia è una cartella di file che contiene i dati che vengono forniti al modello. È organizzata in una struttura a cascata in cui ogni sottodirectory, o "ramo", dell'"albero" della tassonomia termina con un "nodo foglia", che è un insieme di file che contengono i dati pertinenti. È possibile contribuire a una tassonomia aggiungendo un "ramo" completamente nuovo o aggiungendo nuovi dati a un file qna.yaml esistente. Per ulteriori informazioni sulla struttura della tassonomia, vedere Informazioni sulla tassonomia di InstructLab nei documenti di InstructLab. È inoltre possibile consultare la tassonomia di InstructLab su GitHub.

Per i passaggi relativi alla creazione o all'aggiunta di una tassonomia, vedere Preparazione delle tassonomie.

Dati della tassonomia

La tassonomia prevede tre categorie di dati.

Knowledge
Dati e fatti supportati da fonti come libri di testo o enciclopedie. Quando si aggiungono conoscenze a una tassonomia, è necessario fare riferimento a un documento di conoscenza separato che esiste al di fuori della directory della tassonomia e funge da fonte di verità.
Competenze fondamentali
Competenze di base come la matematica, il linguaggio e la programmazione che possono essere utilizzate per acquisire ulteriori conoscenze. Queste competenze vengono solitamente sviluppate utilizzando dati pubblici.
Capacità compositive
Abilità che combinano conoscenze e competenze fondamentali per portare a termine compiti più complessi, come l'analisi del mercato azionario.

Per ulteriori informazioni sulle categorie, vedere Che cos'è una "abilità"? e Che cos'è una "conoscenza"? nei documenti di InstructLab.

File di tassonomia

Per ogni "nodo foglia" sono necessari due tipi di file di dati.

qna.yaml
Include domande e risposte relative alle informazioni contenute nel documento di conoscenza. Le domande e le risposte sono organizzate come coppie chiave/valore.
attribution.txt
Include le fonti delle informazioni aggiunte al file qna.yaml. È facoltativo, ma è necessario per i contributi al repository di tassonomia open-source InstructLab.

Documenti di conoscenza

Ogni conoscenza aggiunta a una tassonomia deve essere supportata da un documento di conoscenza, che funge da fonte di verità per le informazioni immesse nel modello. Il documento deve essere un file Markdown che esiste in una directory separata dalla tassonomia. Nella sezione document_outline del file qna.yaml si fa riferimento al documento di conoscenza e alla directory in cui è memorizzato. Per ulteriori informazioni ed esempi di documenti di conoscenza, vedere Preparazione dei documenti di conoscenza ed Esempio di documento di conoscenza.

Conoscenza qna.yaml file

Il file qna.yaml contiene domande e risposte basate sulle informazioni contenute nel documento di conoscenza pertinente. Le domande e le risposte sono memorizzate come coppie chiave/valore e per ogni file qna.yaml è richiesto un minimo di cinque coppie. Alla fine del file qna.yaml, nella sezione document_outline, si deve fare riferimento al documento di conoscenza e alla directory in cui è memorizzato. Per i requisiti completi del file qna.yaml e per gli esempi di contributi di conoscenza, vedere il modello di file qna.yaml e l'esempio di un contributo di conoscenza.

Competenze qna.yaml file

Il sito qna.yaml contiene domande e risposte che insegnano un compito semplice. Per insegnare a un modello a fare la rima, ad esempio, si potrebbe includere una domanda come What are 5 words that rhyme with skill? con la risposta spill, mill, drill, fill, chill. Le domande e le risposte sono memorizzate come coppie chiave/valore e per ogni file qna.yaml è richiesto un minimo di cinque coppie.

Le abilità che si aggiungono possono essere "grounded", cioè richiedono input aggiuntivi per aggiungere il contesto, o "ungrounded", cioè non richiedono alcun contesto aggiuntivo. Per le competenze a terra, si aggiunge il contesto nel file qna.yaml con il campo context. Quando si aggiunge un'abilità fondata a una tassonomia, questa deve trovarsi in un ramo che inizia con la parola grounded, come ad esempio grounded/games/sudoku.

Per i requisiti completi di qna.yaml e per gli esempi di contributi alle competenze, vedere I file delle competenze nella documentazione di InstructLab. Non è necessario aggiungere un documento separato quando si aggiungono le competenze.