Un Property Graph es un modelo de datos que organiza la información como una red de nodos (vértices) y aristas (bordes). Cada nodo representa una entidad (por ejemplo, un usuario, un producto, una ubicación) y puede tener un conjunto de propiedades clave-valor. Similarmente, cada arista representa una relación dirigida entre dos nodos (por ejemplo, 'AMIGO_DE', 'COMPRO', 'UBICADO_EN') y también puede tener sus propias propiedades clave-valor. Esta capacidad de adjuntar propiedades tanto a nodos como a aristas es lo que distingue al Property Graph, permitiendo modelar relaciones complejas y contextuales de manera muy expresiva.
En el mundo real, los Property Graphs son la base de la mayoría de las bases de datos de grafos (Graph Databases) modernas. Ejemplos prominentes incluyen Neo4j, que es una de las bases de datos de grafos más populares y utiliza Cypher como su lenguaje de consulta. Amazon Neptune soporta el modelo Property Graph a través de Apache TinkerPop Gremlin y SPARQL. Otros sistemas como ArangoDB también ofrecen capacidades de Property Graph junto con otros modelos de datos. Estos sistemas se utilizan en casos de uso como detección de fraude, sistemas de recomendación, gestión de redes sociales, análisis de impacto en infraestructura y gestión de identidad y acceso.
Para un arquitecto, el Property Graph es crucial porque ofrece una forma intuitiva y eficiente de modelar y consultar datos altamente interconectados, donde las relaciones son tan importantes como las entidades mismas. Permite consultas de 'saltos' (traversals) de manera performante, lo cual es difícil y costoso con bases de datos relacionales o NoSQL tradicionales. Sin embargo, los trade-offs incluyen una curva de aprendizaje para nuevos lenguajes de consulta (ej. Cypher, Gremlin), consideraciones de escalabilidad horizontal que pueden ser más complejas que en bases de datos clave-valor o documentales, y la necesidad de evaluar si la complejidad del modelo de grafo justifica su adopción frente a soluciones más simples para datos menos conectados. Es ideal cuando la conectividad y las relaciones son de primera clase para el dominio del problema.