Le problème des LLMs seuls
Les LLMs sont puissants mais ont des limites fondamentales :
- Hallucinations : Ils inventent des faits avec confiance
- Pas de raisonnement structuré : Ils ne peuvent pas garantir la cohérence logique
- Pas d'explication : Impossible de tracer pourquoi une réponse a été donnée
La solution : Graphes de connaissances
TypeDB est une base de données de graphes fortement typée avec un moteur de raisonnement intégré.
Pourquoi TypeDB plutôt que Neo4j ?
| Critère | Neo4j | TypeDB |
|---|---|---|
| Typage | Faible | Fort (schema required) |
| Raisonnement | Manuel (Cypher) | Automatique (règles) |
| Intégrité | À gérer | Garantie par le schéma |
Architecture hybride
L'idée d'Orion était de combiner :
- LLM pour l'extraction d'entités à partir de texte
- TypeDB pour le stockage structuré et le raisonnement
- Attraction Engine pour le calcul de similarité topologique
Exemple concret
define
person sub entity,
owns name,
plays candidate:candidate;
skill sub entity,
owns name;
has-skill sub relation,
relates skilled,
relates skill;
Avec ce schéma, TypeDB peut automatiquement inférer des relations et garantir la cohérence.
Ce que j'ai appris
Les graphes de connaissances sont puissants, mais :
- La courbe d'apprentissage est raide
- Le marché n'est pas prêt pour des solutions complexes
- La valeur doit être démontrée simplement
C'est cette leçon qui m'a poussé à pivoter vers des produits plus simples comme LesProtocoles.fr.