Evaluación crítica de 3D-DXA y 3D-Shaper: limitaciones metodológicas y sus implicaciones

Tristan Whitmarsh
Institute of Astronomy, University of Cambridge, Cambridge, UK

Original peer-reviewed article:
Tristan Whitmarsh, Critical evaluation of 3D-DXA and 3D-Shaper: methodological limitations and their implications, JBMR Plus, Volume 9, Issue 9, September 2025, ziaf075, https://doi.org/10.1093/jbmrpl/ziaf075.

Resumen

3D-DXA, tal como se implementa en la herramienta de software 3D-Shaper, es un método que genera una reconstrucción 3D del fémur proximal a partir de una sola imagen DXA 2D registrando un modelo estadístico. Las implementaciones de 3D-DXA pretenden proporcionar estimaciones de parámetros trabeculares, corticales y estructurales similares a los derivados de la tomografía computarizada cuantitativa (QCT). Como inventor y desarrollador de los métodos en los que se basa 3D-DXA, he observado su adopción y uso extendido con creciente preocupación. Este artículo ofrece una evaluación crítica de las limitaciones metodológicas inherentes a 3D-DXA y analiza sus implicaciones para la investigación y la atención al paciente.

El principal problema es que la escasa visibilidad de la corteza en una imagen DXA impide que 3D-DXA derive con precisión parámetros corticales. En su lugar, el software se basa en predicciones apoyadas en la densidad mineral ósea total (bone mineral density, BMD) en lugar de mediciones corticales directas. Esto puede conducir a resultados que no reflejan mediciones corticales reales.

Preocupan además el sesgo poblacional debido a que el modelo estadístico se deriva de una demografía específica, y la precisión limitada de la reconstrucción al utilizar imágenes DXA de una sola proyección.

Estas limitaciones probablemente han producido mediciones incorrectas y conclusiones de investigación sesgadas, que han pasado en gran parte inadvertidas por el uso de métricas de evaluación inadecuadas y por la ausencia de correcciones por comparaciones múltiples en estudios con 3D-DXA.

A pesar de estas limitaciones, 3D-DXA ha recibido aprobación regulatoria en varios países, lo que potencialmente compromete la precisión de diagnósticos y decisiones terapéuticas. Al destacar estos problemas, este artículo pretende informar a clínicos, investigadores y organismos reguladores sobre las limitaciones sustanciales de 3D-DXA y subrayar la necesidad urgente de reevaluar su uso para evitar interpretaciones erróneas y garantizar la seguridad del paciente.

Palabras clave

3D-DXA, 3D-Shaper, Quantitative Computed Tomography, bone mineral density, Dual-energy X-ray Absorptiometry, mapeo de parámetros corticales, Hip Structure Analysis.

Resumen para público general

Esta revisión examina críticamente el software 3D-DXA, también conocido como 3D-Shaper, que intenta estimar parámetros trabeculares, corticales y estructurales del fémur proximal a partir de una única imagen DXA. 3D-DXA presenta varias limitaciones inherentes que pueden conducir a mediciones inexactas, con posible impacto en los resultados de investigación y en las decisiones de tratamiento. Comprender estos problemas es fundamental para evitar interpretaciones erróneas que afecten a la fisiología ósea, a los efectos de los fármacos y a la seguridad del paciente.

Introducción

3D-DXA es un método que registra un modelo estadístico deformable 3D sobre una imagen DXA 2D para generar un modelo 3D del fémur proximal [1]. El modelo se construye a partir de QCT de una población caucásica española de 81 mujeres y 30 hombres con edad media 56.2 ± 12.1 años (rango 30-84) [2]. Los parámetros del modelo describen la variación principal en forma y distribución de densidad de esa población. En un proceso iterativo, se buscan los parámetros del modelo y la pose (posición, orientación y escala) hasta que la proyección del modelo se asemeje a la imagen DXA (Figura 1). A partir del modelo 3D resultante se miden parámetros corticales sobre la superficie ósea y la volumetric bone mineral density (vBMD) trabecular interna. Se informó un error absoluto medio de 0.33 mm para el espesor cortical y de 72 mg/cm³ para la densidad cortical al comparar con QCT, con coeficientes de correlación ≥ 0.86 [2].

Diagrama de flujo del proceso iterativo de 3D-DXA.
Figura 1. Diagrama de flujo del proceso iterativo que usa 3D-DXA para reconstruir la forma y la distribución de densidad del fémur proximal a partir de una imagen DXA 2D. En cada iteración se genera una proyección del modelo de densidad deformado (digitally reconstructed radiograph, DRR) y se compara con la imagen DXA real mediante una medida de similitud (p. ej., mean squared error). Los parámetros del modelo y la transformación (rotación, traslación y escala) se ajustan para aumentar la similitud hasta un umbral de convergencia predeterminado. Adaptado de [3].

Aunque se han propuesto otros métodos para reconstrucción 3D de estructuras óseas a partir de DXA con un modelo estadístico [4, 5], el método publicado en 2010 [6] fue posteriormente comercializado como 3D-DXA por Galgo Medical SL (Barcelona, España), una spin-off de la Universitat Pompeu Fabra. Más tarde se amplió para medir espesor cortical y cortical BMD a partir de las reconstrucciones volumétricas [2], y hoy se comercializa como 3D-Shaper por 3D-Shaper Medical SL (Barcelona, España), como servicio y como software. DMS Imaging (Mauguio, Francia) tiene licencia para venderlo como 3D-DXA con sus dispositivos DXA Stratos/Medix. Fujifilm (Tokio, Japón) vende esos mismos dispositivos bajo la marca FDX Visionary DXA. Imex Medical (São José, Brasil) los vende como serie Elipse y Radiología SA (Madrid, España) como Radioscore - DR. Todos incluyen la opción 3D-DXA.

Habiendo desarrollado el método original [1], conozco profundamente limitaciones que quizá no sean evidentes para otros. Aunque ya expuse la limitación principal en una carta a la revista Bone [7], 3D-DXA sigue comercializándose y utilizándose en todo el mundo. 3D-Shaper ha recibido aprobación regulatoria en la UE, Japón, Tailandia y Argentina, y una autorización 510(k) de la FDA para uso en diagnóstico y decisiones terapéuticas. Dado este respaldo, es crítico aclarar malentendidos y explicar las limitaciones.

Limitaciones metodológicas

En esta sección explico limitaciones del enfoque en que se basa 3D-DXA y detalles de implementación que pueden añadir inexactitudes.

Los parámetros corticales no se miden

El problema central es la falta de visibilidad de la corteza en imágenes DXA, que impide a 3D-DXA medir parámetros corticales. La Figura 2 ilustra que, en la mayor parte de la superficie, no hay corteza discernible de la que derivar parámetros. Esto es válido para el contorno de la proyección (A) y especialmente donde dos corticales opuestas son perpendiculares al detector (B). Se aprecia con un escáner GE iDXA (tamaño de píxel 0.3 x 0.25 mm) y aún más con GE Prodigy (0.6 x 1.05 mm), también soportados por 3D-Shaper.

Ejemplo de DXA de cadera con escáner GE iDXA.
Figura 2. Ejemplo de exploración DXA de cadera en adulto joven adquirida con GE iDXA. Figura publicada previamente en [7].

En lugar de medir directamente desde DXA, 3D-DXA registra un modelo estadístico de forma y densidad sobre la imagen DXA [7] y extrae los parámetros corticales de ese modelo [2]. El modelo se construye a partir de QCT calibradas en las que las unidades Hounsfield se convierten a BMD con un fantoma de calibración.

Para construir el modelo, se segmenta el fémur proximal en cada QCT (malla superficial). Se aplica análisis de componentes principales (PCA) a las superficies alineadas para obtener una forma media y componentes principales (PC) que describen las variaciones.

Para la distribución de densidad, los volúmenes QCT se deforman a la forma media y se aplica la misma técnica a los valores de BMD, generando un volumen medio y PC que describen la variación de densidad.

Cada componente principal representa una forma en que puede variar la forma o la densidad (Figura 3). Los parámetros del modelo (pesos) determinan cuánto se suma de cada componente. Normalmente se limitan a 2.5-3 desviaciones estándar para mantener instancias realistas. Para crear una instancia nueva, el volumen de densidad se deforma a la nueva forma usando Thin Plate Splines.

Media y tres primeros componentes del modelo de forma (izquierda) y proyecciones del modelo de densidad (derecha), entre -3 y +3 SD.
Figura 3. Media y tres primeros componentes principales (PC) del modelo de forma (izq.) y proyecciones del modelo de densidad (der.), variando entre -3 y +3 desviaciones estándar. Adaptado de [3].

3D-DXA busca iterativamente parámetros y pose hasta que la proyección del modelo coincide suficientemente con la imagen DXA (Figura 1).

El espesor y la densidad cortical se miden después en la instancia del modelo con un método equivalente a un enfoque de deconvolución propuesto para QCT [8]. Por tanto, los parámetros corticales no se miden en la imagen DXA, sino que se derivan de un modelo paramétrico registrado sobre ella.

Cuando 3D-DXA muestra mapas corticales con valores en lugares donde no hay corteza visible [9 a 13], esos mapas provienen del modelo. Aunque 3D-Shaper Medical aclara en una respuesta que son estimaciones [14], una descripción más precisa es que 3D-DXA predice estos valores con un método estadístico complejo y potencialmente propenso a error. Dada la limitada información cortical en DXA, el software se apoya sobre todo en la BMD total y queda limitado por las características estadísticas de la población española usada para construir el modelo.

Ejemplo de generación de una instancia del modelo de densidad y medición de parámetros corticales.
Figura 4. Ejemplo de generación de una instancia del modelo de densidad y medición de parámetros corticales a partir de ese volumen. Arriba: cortes del modelo (media, PC1-3 e instancia nueva). Abajo: valores de vóxeles a lo largo de una línea (en rojo). Izquierda: ajuste de un modelo de escalones suavizado para estimar espesor cortical y cortical vBMD, del que se deriva la surface BMD (sBMD) sobre la superficie.

Número de parámetros del modelo

No existe un único parámetro que aumente solo el espesor cortical. La representación de la corteza depende de una combinación lineal del volumen medio y de las PC del modelo de densidad. La Figura 4 ilustra cómo la media y las tres primeras PC generan una instancia nueva. Ajustes selectivos e independientes de espesor cortical, densidad cortical o densidad trabecular requieren combinaciones complejas de múltiples componentes y, por tanto, muchos parámetros.

Normalmente se conserva un subconjunto de componentes que explican la mayor parte de la variación. El número de parámetros suele fijarse por varianza explicada acumulada (p. ej., 95%) o por el "codo" de la curva. Más riguroso es el análisis paralelo de Horn [6] para descartar componentes que representan ruido.

Aunque el número de parámetros es crítico, que se sepa 3D-Shaper Medical no ha divulgado ni la cifra ni el método para derivarla. Si el número no es lo bastante grande según Horn, el modelo podría no representar la variabilidad de la población objetivo. Si además difiere entre investigación y clínica, aparecerá una desconexión entre precisión reportada y clínica.

Posible sesgo poblacional

Cualquier modelo 3D de 3D-DXA se deriva de la variación observada en la población de entrenamiento. En 3D-Shaper, el modelo se construye con una población española de 81 mujeres y 30 hombres con edad media 56.2 ± 12.1 años [2, 15]. La morfología femoral difiere por sexo y también por demografía. Por ejemplo, difiere de forma significativa entre poblaciones caucásicas y asiáticas [16].

Un modelo construido con población caucásica no puede generar reconstrucciones precisas para todas las personas de una población asiática cuando los parámetros se limitan a ±3 SD alrededor de la media española. Un estudio informa, por ejemplo, un espesor cortical en cuello femoral de 1.84 ± 0.03 mm en mujeres blancas frente a 2.41 ± 0.71 mm en mujeres coreanas [17]. Un promedio de 2.41 mm quedaría fuera del rango caucásico a ±3 SD (1.75-1.93 mm). Esto resalta la importancia de ajustar el modelo a la población objetivo.

Aunque medidas de 3D-DXA correlacionan con QCT en población japonesa [18], ello se debe a que todos los parámetros correlacionan con areal BMD (aBMD). No implica reconstrucciones específicas por paciente. Las estimaciones corticales pueden desviarse notablemente en valor absoluto y en su distribución espacial. Incluso con forma errónea, las densidades (incluyendo espesor y BMD cortical) seguirán el aBMD mientras la proyección del modelo se solape con el hueso de la DXA. Pese a esta limitación, 3D-DXA se comercializa en Asia (Japón, Tailandia, India).

Un modelo estadístico debe entrenarse en la población en que se va a aplicar. Esto puede lograrse con modelos separados por sexo, etnia y, en su caso, tipo de tratamiento, o bien incluyendo suficientes individuos de todos los subgrupos en un mismo modelo con suficientes parámetros. Este principio es habitual en aprendizaje automático [19 a 22], y es aún más crítico en modelado estadístico, donde el modelo se restringe activamente por la población de entrenamiento. No obstante, 3D-DXA se ha usado en poblaciones muy diversas: bailarines profesionales [9], futbolistas y nadadoras [23], mujeres jóvenes con obesidad [24], mujeres negras [25], pacientes con masa ósea alta [11], adultos con déficit de hormona del crecimiento [26], enfermedad psoriásica [27], diabetes tipo 2 [28], hiperparatiroidismo primario [10, 29], acromegalia [30], síndrome de Down [13], tras gastrectomía en manga [31], hombres con lesión medular [32], varones australianos de mediana y avanzada edad con masa ósea baja [33], y supervivientes pediátricos de cáncer [34].

Precisión limitada de la reconstrucción

3D-DXA es complejo y susceptible a errores en múltiples etapas: calibración QCT, registro deformable para construir el modelo, deformación del volumen de densidad a la forma, discrepancias de BMD y resolución entre QCT y DXA, y simplificación de la proyección (isométrica en lugar de fan beam). Cada factor puede introducir sesgos de forma imprevisible. Además, detalles como el reducido conjunto de entrenamiento de 111 adultos españoles limitan la variabilidad de forma, densidad y espesor cortical, restringiendo la aplicabilidad.

También es incierto que 3D-Shaper lea correctamente archivos propietarios de GE y Hologic y aplique adecuadamente calibraciones y correcciones por composición corporal. Posibles inexactitudes podrían influir en resultados al aplicarse a distintas poblaciones o con cambios temporales en ellas.

Parece razonable que, si la forma y la orientación del fémur proximal no se ajustan con precisión submilimétrica, tampoco puedan estimarse con esa precisión el espesor y la densidad corticales. Un estudio temprano mostró que añadir una segunda vista reduce el error de forma de 1.3 mm a 0.9 mm y el error de BMD de 4.4% a 3.2% [35], indicando que una sola vista es subóptima. En contraste, la CT reconstruye a partir de cientos de proyecciones y permite medir independientemente parámetros corticales y trabeculares.

3D-DXA puede producir morfologías femorales muy distintas según el mínimo al que converge la búsqueda de parámetros, especialmente si la rotación es incorrecta. En un estudio con DXA repetidas el mismo día, las diferencias en fuerza estimada alcanzaron hasta 62% [36], y las diferencias de BMD elemento a elemento 30 ± 50%, lo que sugiere baja repetibilidad también para parámetros corticales. En otro estudio, la correlación entre densidades de 3D-Shaper y QCT fue baja (r2 = 0.48) [37].

Para parámetros estructurales, se informó r = 0.86 para longitud del eje del cuello femoral comparando 3D-DXA con CT [38], peor que medido directamente en la imagen DXA (r = 0.90 [39]). El ángulo cuello-diáfisis de 3D-DXA también mostró precisión limitada (r = 0.71 [38]), en parte porque la cabeza femoral se excluye con una máscara para evitar la superposición con el hemipelvis. Un modelo adicional de pelvis podría mitigarlo [5].

En un estudio sobre parámetros corticales, la diferencia media (± DE) entre 3D-DXA y QCT fue 0.04 ± 0.21 mm en el cuello y -0.07 ± 0.15 mm en el trocánter [2]. La figura 5 muestra el error medio y máximo absolutos sobre la superficie, con error medio > 0.2 mm y máximos > 1 mm. En comparación, un estudio QCT tras 18 meses de alendronato informó un aumento de 1.4% (≈ 0.018 mm) [40]; datos de tres ensayos con teriparatida mostraron ≈ 0.035 mm [41]. Como el error de 3D-DXA excede esos cambios, es improbable que distinga con fiabilidad efectos terapéuticos reales de ruido metodológico.

Mapa codificado por colores de errores de espesor cortical estimado por 3D-DXA.
Figura 5. Mapa del error medio (arriba) y máximo (abajo) del espesor cortical estimado por 3D-DXA con respecto a QCT en los mismos sujetos. Adaptado de la Figura 8 en [2].

Beneficio limitado frente a areal BMD

En el modelo estadístico de densidad, el primer componente explica la mayor parte de la varianza, y aumentarlo eleva la densidad global y los parámetros corticales [7]. Dado que hay poca información cortical visible en DXA, 3D-DXA depende sobre todo de ese componente, por lo que los parámetros trabeculares y corticales están correlacionados intrínsecamente con aBMD. Cuando aBMD aumenta, el análisis 3D-DXA mostrará aumentos simultáneos en trabecular vBMD, cortical BMD y espesor cortical. Estudios recientes (ECTS 2024 y ASBMR 2024) confirman que los parámetros de 3D-Shaper se correlacionan fuertemente con aBMD y no aportan información adicional de predicción de fractura [42, 43].

Además, aunque la reconstrucción capta el contorno femoral visible en DXA, recupera con precisión limitada la longitud del eje del cuello y el ángulo cuello-diáfisis. Por ello, la forma reconstruida refleja principalmente el tamaño óseo general, ya implícito en aBMD, con escasa aportación a la predicción de resistencia. Ilustrativo: la resistencia predicha a partir de 3D-DXA correlacionó con QCT (r2 = 0.88) pero no superó la predicción por aBMD del cuello femoral sola (r2 = 0.87) [37]. Un estudio de 3D-Shaper Medical mostró correlación similar (r2 = 0.86) pero sin comparar con aBMD [44]. En una cohorte japonesa, las medidas de 3D-Shaper no fueron estadísticamente mejores que el aBMD de cadera total [45].

Otros trabajos con un enfoque similar de registro 3D sobre DXA reportaron en algunos casos mejora frente a aBMD [46 a 48], quizá por usar un modelo pélvico adicional, pero persisten las mismas limitaciones fundamentales.

Si 3D-DXA no supera a aBMD por sí sola, difícilmente superará una combinación de aBMD con parámetros de Hip Structure Analysis (HSA) medidos directamente en DXA. Aun así, 3D-Shaper Medical ofrece ahora un servicio de análisis por elementos finitos basado en 3D-DXA.

Métodos de validación

Pese a las limitaciones, múltiples publicaciones reportan hallazgos positivos sobre la precisión de 3D-DXA. Esto se explica en parte por el uso de métodos de validación inadecuados [21, 22] que tienden a enmascarar las limitaciones reales. A continuación se discuten esos problemas.

Métricas de desempeño inadecuadas

3D-Shaper Medical comparó la malla superficial generada por 3D-DXA a partir de DXA con la malla obtenida manualmente de la QCT del mismo sujeto, hallando una distancia punto-superficie media de 0.93 mm [2]. También comparó parámetros corticales, con error absoluto medio 0.33 mm para espesor y 72 mg/cm³ para densidad. Sin marco de referencia para juzgar la aceptabilidad de tales errores, estas métricas no validan necesariamente la eficacia del software.

Otra vía de evaluación han sido las correlaciones. Se han reportado coeficientes de 0.86, 0.93, 0.95 y 0.91 para vBMD trabecular, cortical e integral, y para espesor cortical, respectivamente. Sin embargo, tales correlaciones fuertes se deben principalmente a que todos los parámetros en modelos 3D-DXA y en QCT se correlacionan con la densidad global. Pacientes con aBMD superior a la media mostrarán, por término medio, mayor trabecular, cortical e integral vBMD y mayor espesor cortical. Estas correlaciones no prueban reconstrucciones específicas por paciente.

También en estudios poblacionales con 3D-DXA, correlaciones significativas entre parámetros y factores probados pueden dar la falsa impresión de que 3D-DXA capta cambios propios, cuando en realidad reflejan cambios en aBMD. Una evaluación más adecuada sería comparar contra un modelo basal simple como un estimador ciego (p. ej., aplicar el mapa medio de espesor cortical de una cohorte a todos los sujetos). Cualquier método sofisticado debería superarlo. Hasta donde sabemos, tal evaluación no se ha publicado.

La mayoría de publicaciones muestran solo reconstrucciones satisfactorias, generando una confianza excesiva. Para evaluar fiabilidad debería informarse la tasa de fallos. En un estudio previo [51], aunque no se explicitó, solo 80 de 173 sujetos se retuvieron tras excluir reconstrucciones inexactas mediante comparación visual de proyección y DXA, lo que sugiere una tasa de fallo superior a 50%. Para ello, 3D-Shaper debería mostrar la proyección del modelo junto a la DXA y, de forma más robusta, comparar renderizados y cortes con QCT.

En ocasiones se presenta la mera existencia de cambios significativos como evidencia de validez, sin considerar si los efectos son correctos en términos fisiológicos. En respuesta a mi carta, se mostraron resultados contradictorios para cambios en cortical BMD tras teriparatida, uno con aumento significativo [52] y otro sin cambios significativos [15], mientras que QCT suele mostrar disminución por aumento de remodelación, como se detalla más abajo.

Ausencia de corrección por comparaciones múltiples

Este problema afecta sobre todo a publicaciones que usan el servicio de 3D-Shaper. El software genera 71 parámetros; cada uno es una prueba estadística independiente. Sin correcciones por múltiples comparaciones (p. ej., Bonferroni), aumenta la probabilidad de falsos positivos. Aun así, a menudo no se aplican [10, 24, 27, 28].

Algo similar ocurre con mapas codificados por colores sobre la superficie o en volumen. Cada vértice o vóxel constituye una prueba individual, y la significación suele evaluarse con una t de Student punto a punto [9 a 12, 13, 28, 52, 54, 55], o ni siquiera se informa en mapas volumétricos [9, 11, 30, 52, 54, 55, 56]. Esto crea la ilusión de cambios localizados cuando pueden ser ruido, sobrestimando la eficacia de intervenciones.

En neuroimagen este problema es bien conocido [57]. El campo ha desarrollado soluciones aplicables aquí, como SurfStat para superficies (teoría de campo aleatorio) y SPM/FSL para vóxeles [58]. Su uso incrementaría el rigor estadístico en estudios con 3D-DXA, aunque los cambios observados seguirían reflejando en gran medida la dependencia de aBMD.

Implicaciones

Resultados engañosos en estudios de eficacia farmacológica

En la mayoría de estudios, los resultados de 3D-DXA concuerdan con lo esperado en la corteza, ya que en individuos sanos los parámetros corticales se correlacionan con aBMD. El enfoque falla cuando los cambios no son proporcionales, como en terapias anabólicas.

Un ejemplo es teriparatida: un estudio 3D-DXA informó aumentos en todos los parámetros corticales, con incremento significativo en cortical vBMD frente a placebo [52]. En cambio, análisis QCT equivalentes muestran descensos significativos de la densidad cortical tras 18-24 meses de tratamiento, atribuibles al aumento de porosidad por mayor remodelación [41, 59]. Otros estudios 3D-DXA informan ausencia de cambios significativos [15, 60]. Posibles contribuciones visibles de la corteza diafisaria en DXA podrían propagarse globalmente por el modelo, sin reproducir la disminución observada con QCT.

En el caso de abaloparatida, estudios 3D-DXA también informaron aumentos [52, 55, 56], mientras que un estudio QCT con 35 pacientes observó una disminución no significativa de la densidad cortical [61]. Para romosozumab, un análisis 3D-DXA mostró incrementos generalizados [54], mientras que QCT no encontró aumento en la densidad cortical [62]. Esta discrepancia era previsible a la luz de las limitaciones mencionadas [7].

Estos estudios además difunden resultados posiblemente erróneos mediante mapas de cambios "locales" de color. 3D-DXA no puede medir patrones locales específicos del paciente, pues cada parámetro del modelo afecta globalmente a la distribución de densidad y DXA aporta escasa información cortical local. Sin correcciones adecuadas por múltiples comparaciones, estos mapas conducen a una valoración demasiado optimista de diversos fármacos.

Manejo del paciente

Aunque 3D-Shaper puede calcular 71 métricas, la versión aprobada clínicamente produce principalmente la trabecular vBMD y la cortical surface BMD (sBMD) globales, además de T-score y Z-score. No está claro de qué población proceden esas referencias; en un seminario se mencionan datos de referencia caucásicos [63]. Se han publicado curvas de referencia para poblaciones española y argentina (Figura 6) [64, 65], que parecen diferir entre sí y de las figuras generadas por el software. El distribuidor japonés confirma que la versión aprobada allí no usa referencia de población japonesa. Dadas las diferencias entre poblaciones caucásicas y asiáticas [68], conviene ser prudentes.

Datos de referencia para poblaciones española (izquierda) y argentina (derecha).
Datos de referencia para poblaciones española (izquierda) y argentina (derecha), derivados de [66] y [67].

El material promocional sugiere una tabla para apoyar la elección terapéutica basada en 3D-DXA (Tabla A-C en "tab-bone_density_changes"). Los umbrales subyacentes parecen arbitrarios o no especificados; además, los resúmenes estudio por estudio difieren de la simbología mostrada en la tabla, lo que cuestiona su validez para la toma de decisiones clínicas.

En un webinario [66] se propuso que, ante sBMD baja y vBMD muy baja, teriparatida sería preferible porque mejoraría más el hueso trabecular. Sin embargo, un clínico también podría preferir denosumab o abaloparatida según qué parámetros se prioricen y sin considerar aBMD vertebral.

En la práctica, 3D-DXA se usará junto con las T- y Z-scores de DXA habitual. El riesgo de pasar por alto pacientes de alto riesgo es mínimo, pero en casos limítrofes el ruido de sBMD y vBMD puede inclinar la balanza hacia prescripción de fármacos. Un estudio sobre Trabecular Bone Score (TBS) mostró que una métrica adicional influye de forma sustancial en decisiones terapéuticas [77]; algo similar podría ocurrir con 3D-DXA.

Para seguimiento, 3D-DXA es problemático: los errores superan los cambios esperados y la repetibilidad es baja [36]. Los cambios observados pueden ser ruido y no fisiología, lo que puede llevar a ajustes terapéuticos innecesarios.

(A)
2D DXA (Total hip) aBMD3D-DXA (3D-Shaper) Trabecular vBMD3D-DXA (3D-Shaper) Cortical sBMD
Alendronate+++
Denosumab++++++
Zoledronic acid++++
Teriparatide [3, 4, 5, 6]*+++=
Abaloparatide++++++
Romosozumab+++++++++
(B)
aBMDvBMDsBMD
Teriparatide [4, 5] (18 meses)++ (3.3%)++/+++ (9%)+ (1.8%)
Teriparatide [6] (24 meses)= (p > 0.05)++/+++ (5.9%)= (p > 0.05)
Teriparatide [7] (24 meses)= (p > 0.05)++/+++ (>14%)= (p > 0.05)
(C)
Símbolo(Total hip) aBMDTrabecular vBMDCortical sBMD
+++Δ > n/a %Δ > n/a %Δ > n/a %
++2 < Δ ≤ n/a %4 < Δ ≤ n/a %2 < Δ ≤ n/a %
+0.5 < Δ ≤ 2 %0.5 < Δ ≤ 4 %0.5 < Δ ≤ 2 %
=-0.5 ≤ Δ ≤ 0.5 %-0.5 ≤ Δ ≤ 0.5 %-0.5 ≤ Δ ≤ 0.5 %
--2 ≤ Δ < -0.5 %-4 ≤ Δ < -0.5 %-2 ≤ Δ < -0.5 %
--Δ < -2 %Δ < -4 %Δ < -2 %
Estas tablas ilustran cómo 3D-Shaper Medical propone usar un análisis 3D-DXA para apoyar la elección de tratamiento. (A) Tabla del material promocional; se muestran solo las referencias de teriparatida. (B) Efectos de teriparatida informados por estudios 3D-DXA, más un estudio adicional. (C) Umbrales que determinan los símbolos cuando están disponibles. * La inclusión de [3] parece un error (no contiene teriparatida).

Discusión

En resumen, 3D-DXA produce diversos parámetros que aparentan ser muy detallados, pero reflejan principalmente la areal BMD global en lugar de medir propiedades corticales o trabeculares independientes. Aunque en poblaciones donde los cambios corticales y trabeculares son proporcionales a aBMD los resultados puedan parecer plausibles, el método no capta de forma fiable mediciones específicas de paciente ni cambios localizados. Esta limitación es especialmente relevante con terapia anabólica, donde los compartimentos pueden cambiar de forma discordante, observado por QCT pero no por 3D-DXA.

3D-DXA se desarrolló inicialmente para mejorar el diagnóstico de osteoporosis proporcionando una estimación de integral vBMD [70, 71]. Al no intentar separar estrictamente corteza y trabécula, la integral vBMD de 3D-DXA puede aún ser una estimación válida. Más tarde se amplió para mejorar la estimación de riesgo de fractura analizando directamente parámetros del modelo [51, 72 a 74]. Sin embargo, las limitaciones clave descritas aquí siguen socavando su precisión y fiabilidad.

Este estudio se ve limitado por la falta de transparencia de las empresas que comercializan 3D-DXA, incluidas 3D-Shaper Medical, DMS Imaging y Fujifilm. En consecuencia, se basa en información pública y en mi experiencia en el desarrollo de esta metodología. Animo a los lectores a solicitar aclaraciones a estas empresas o a sus representantes cuando falten detalles.

Las evaluaciones de sociedades profesionales pueden aportar orientación mediante valoraciones independientes y recomendaciones oficiales sobre el uso de 3D-DXA. Aunque una actualización de directrices sobre DXA indica que se necesita más evidencia para recomendar su aplicación clínica [75], considero que ahora hay suficientes elementos para fundamentar una recomendación, y espero que esta revisión sea útil en ese sentido.

En conclusión, dadas las limitaciones fundamentales de 3D-DXA, mi valoración profesional es que los parámetros corticales y trabeculares que proporciona no deben usarse en investigación, ni son adecuados para aplicaciones clínicas como diagnóstico, monitorización o apoyo a decisiones terapéuticas.

Declaraciones

El autor es coinventor de una patente relacionada con la metodología subyacente a 3D-DXA. El autor ha participado en discusiones sobre la propiedad intelectual y el origen del código del software comercial, los modelos estadísticos y material promocional. El autor no está afiliado a 3D-Shaper Medical ni a otras empresas implicadas en la explotación comercial de 3D-DXA y no ha recibido participaciones, regalías u otra compensación económica. Ha impartido conferencias para UCB y ha recibido financiación de investigación de Amgen Inc. y Lilly. Las opiniones expresadas pertenecen exclusivamente al autor y se basan en una evaluación crítica de la metodología y de la evidencia científica disponible.

References

  1. Whitmarsh T (2012). 3D Reconstruction of the Proximal Femur and Lumbar Vertebrae from Dual-Energy X-Ray Absorptiometry for Osteoporotic Risk Assessment
  2. Humbert L, Martelli Y, Fonolla R, et al. (2017). 3D-DXA: Assessing the Femoral Shape, the Trabecular Macrostructure and the Cortex in 3D from DXA images. IEEE Transactions on Medical Imaging, 36(1), 27–39.
  3. Whitmarsh T, Humbert L, De Craene M, et al. (2011). Reconstructing the 3D Shape and Bone Mineral Density Distribution of the Proximal Femur From Dual-Energy X-Ray Absorptiometry. IEEE Transactions on Medical Imaging, 30(12), 2101–2114.
  4. Ahmad O, Ramamurthi K, Wilson KE, et al. (2010). Volumetric DXA (VXA): A new method to extract 3D information from multiple in vivo DXA images. Journal of Bone and Mineral Research, 25(12), 2744–2751.
  5. Väänänen SP, Grassi L, Flivik G, et al. (). Generation of 3D shape, density, cortical thickness and finite element mesh of proximal femur from a DXA image. Medical Image Analysis, 24(1).
  6. Whitmarsh T, Humbert L, De Craene M, et al. 3D bone mineral density distribution and shape reconstruction of the proximal femur from a single simulated DXA image: an in vitro study. In: Dawant BM, Haynor DR, eds. Medical Imaging 2010: Image Processing. Vol. 7623. SPIE; 2010:76234U.
  7. Whitmarsh T. Concerns regarding the use of 3D-DXA. Bone. 2021;149:115939.
  8. Treece G, Gee A (2015). Independent measurement of femoral cortical thickness and cortical bone density using clinical CT. Medical Image Analysis, 20(1), 249–264.
  9. Freitas L, Amorim T, Humbert L, et al. (2018). Cortical and trabecular bone analysis of professional dancers using 3D-DXA: a case–control study. Journal of Sports Sciences, 37(1), 82–89.
  10. Gracia-Marco L, García-Fontana B, Ubago-Guisado E, et al. (2019). Analysis of Bone Impairment by 3D DXA Hip Measures in Patients With Primary Hyperparathyroidism: A Pilot Study. The Journal of Clinical Endocrinology & Metabolism, 105(1), 175–184.
  11. Orduna G, Humbert L, Fonolla R, et al. (2018). Cortical and Trabecular Bone Analysis of Patients With High Bone Mass From the Barcelona Osteoporosis Cohort Using 3-Dimensional Dual-Energy X-ray Absorptiometry: A Case-Control Study. Journal of Clinical Densitometry, 21(4), 480–484.
  12. Gifre L, Humbert L, Muxi A, et al. (2017). Analysis of the evolution of cortical and trabecular bone compartments in the proximal femur after spinal cord injury by 3D-DXA. Osteoporosis International, 29(1), 201–209.
  13. García Hoyos M, Humbert L, Salmón Z, et al. (2019). Analysis of volumetric BMD in people with Down syndrome using DXA-based 3D modeling. Archives of Osteoporosis, 14(1).
  14. Beck B, Harding A, Weeks B, et al. (2021). Response to “Concerns regarding the use of 3D-DXA”. Bone, 149, 115936.
  15. Winzenrieth R, Humbert L, Di Gregorio S, Bonel E, García M, Del Rio L. Effects of osteoporosis drug treatments on cortical and trabecular bone in the femur using DXA-based 3D modeling. Osteoporos Int.2018;29(10):2323–2333.
  16. Cummings SR, Cauley JA, Palermo L, et al. Racial differences in hip axis lengths might explain racial differences in rates of hip fracture. Osteoporos Int.1994;4(4):226–229.
  17. Kim KM, Brown JK, Kim KJ, et al. Differences in femoral neck geometry associated with age and ethnicity. Osteoporos Int. 2010;22(7):2165–2174.
  18. Sone T, Humbert L, Lopez M, et al. (2022). Assessment of femoral shape, trabecular and cortical bone in Japanese subjects using DXA-based 3D modelling. JOURNAL OF BONE AND MINERAL RESEARCH, 37, 214--214.
  19. Varoquaux G, Cheplygina V (2022). Machine learning for medical imaging: methodological failures and recommendations for the future. npj Digital Medicine, 5(1).
  20. Hadjiiski L, Cha K, Chan H, et al. (). AAPM task group report 273: Recommendations on best practices for AI and machine learning for computer‐aided diagnosis in medical imaging. Medical Physics, 50(2).
  21. Huisman M (2024). When AUC-ROC and accuracy are not accurate: what everyone needs to know about evaluating artificial intelligence in radiology. European Radiology, 34(12), 7892–7894.
  22. Gallifant J, Bitterman DS, Celi LA, et al. (2024). Ethical debates amidst flawed healthcare artificial intelligence metrics. npj Digital Medicine, 7(1).
  23. Amani A, Bellver M, del Rio L, et al. (2022). Femur 3D-DXA Assessment in Female Football Players, Swimmers, and Sedentary Controls. International Journal of Sports Medicine, 44(06), 420–426.
  24. Maïmoun L, Renard E, Humbert L, et al. (2021). Modification of bone mineral density, bone geometry and volumetric BMD in young women with obesity. Bone, 150, 116005.
  25. Jain RK, López Picazo M, Humbert L, et al. (2025). Bone Structural Parameters as Measured by 3-Dimensional Dual-Energy X-Ray Absorptiometry Are Superior in Black Women and Demonstrate Unique Associations With Prior Fracture Versus White Women. Endocrine Practice, 31(2), 152–158.
  26. Gracia-Marco L, Gonzalez-Salvatierra S, Garcia-Martin A, et al. (2021). 3D DXA Hip Differences in Patients with Acromegaly or Adult Growth Hormone Deficiency. Journal of Clinical Medicine, 10(4), 657.
  27. Toussirot E, Winzenrieth R, Aubin F, et al. (2024). Areal bone mineral density, trabecular bone score and 3D-DXA analysis of proximal femur in psoriatic disease. Frontiers in Medicine, 11.
  28. Ubago-Guisado E, Moratalla-Aranda E, González-Salvatierra S, et al. (2023). Do patients with type 2 diabetes have impaired hip bone microstructure? A study using 3D modeling of hip dual-energy X-ray absorptiometry. Frontiers in Endocrinology, 13.
  29. Guerra FS, Palladino N, Winzenrieth R, et al. (2024). Advanced 3D-DXA insights into bone density changes in hyperparathyroidism. Journal of Diabetes & Metabolic Disorders, 23(2), 2191–2199.
  30. Kužma M, Vaňuga P, Ságová I, et al. Non-invasive DXA derived bone structure assessment of acromegaly patients: a cross sectional study. Eur J Endocrinol. 2019;180(3):201–211.
  31. Maïmoun L, Aouinti S, Puech M, et al. Modification of bone architecture following sleeve gastrectomy: a five-year follow-up. J Bone Miner Res. 2024;40(2):251–261.
  32. Maïmoun L, Gelis A, Serrand C, et al. (2023). Alteration of Volumetric Bone Mineral Density Parameters in Men with Spinal Cord Injury. Calcified Tissue International, 113(3), 304–316.
  33. Harding AT, Weeks BK, Lambert C, et al. (2020). Effects of supervised high-intensity resistance and impact training or machine-based isometric training on regional bone geometry and strength in middle-aged and older men with low bone mass: The LIFTMOR-M semi-randomised controlled trial. Bone, 136, 115362.
  34. Gil-Cosano JJ, Ubago-Guisado E, Sánchez MJ, et al. (2020). The effect of an online exercise programme on bone health in paediatric cancer survivors (iBoneFIT): study protocol of a multi-centre randomized controlled trial. BMC Public Health, 20(1).
  35. Humbert L, Whitmarsh T, De Craene M, et al. (2010). 3D reconstruction of both shape and Bone Mineral Density distribution of the femur from DXA images. 2010 IEEE International Symposium on Biomedical Imaging: From Nano to Macro, 456–459.
  36. O’Rourke D, Beck BR, Harding AT, et al. (2021). Assessment of femoral neck strength and bone mineral density changes following exercise using 3D-DXA images. Journal of Biomechanics, 119, 110315.
  37. Dudle A, Gugler Y, Pretterklieber M, et al. (2023). 2D-3D reconstruction of the proximal femur from DXA scans: Evaluation of the 3D-Shaper software. Frontiers in Bioengineering and Biotechnology, 11.
  38. Clotet J, Martelli Y, Di Gregorio S, et al. (2018). Structural Parameters of the Proximal Femur by 3-Dimensional Dual-Energy X-ray Absorptiometry Software: Comparison With Quantitative Computed Tomography. Journal of Clinical Densitometry, 21(4), 550–562.
  39. Ramamurthi K, Ahmad O, Engelke K, et al. (2011). An in vivo comparison of hip structure analysis (HSA) with measurements obtained by QCT. Osteoporosis International, 23(2), 543–551.
  40. Whitmarsh T, Treece GM, Gee AH, et al. (2015). Mapping Bone Changes at the Proximal Femoral Cortex of Postmenopausal Women in Response to Alendronate and Teriparatide Alone, Combined or Sequentially. Journal of Bone and Mineral Research, 30(7), 1309–1318.
  41. Whitmarsh T, Treece GM, Gee AH, et al. (2016). The Effects on the Femoral Cortex of a 24 Month Treatment Compared to an 18 Month Treatment with Teriparatide: A Multi-Trial Retrospective Analysis. PLOS ONE, 11(2), e0147722.
  42. Huininga K, Koromani F, Zillikens M, et al. (2024). Use of 3D Shaper Analysis for the Assessment of Fracture Risk in a Population-Based Setting. JBMR Plus, 8(Supplement_1), i1--i340.
  43. Huininga K, Koromani F, Zillikens MC, et al. (2024). Use of 3D Shaper Analysis for the Assessment of Fracture Risk in a Population-based Setting. ASBMR 2024 Annual Meeting Abstracts and Abstract Book.
  44. Qasim M, López Picazo M, Ruiz Wills C, et al. (2024). 3D-DXA Based Finite Element Modelling for Femur Strength Prediction: Evaluation Against QCT. Journal of Clinical Densitometry, 27(2), 101471.
  45. Iki M, Winzenrieth R, Tamaki J, et al. (2021). Predictive ability of novel volumetric and geometric indices derived from dual-energy X-ray absorptiometric images of the proximal femur for hip fracture compared with conventional areal bone mineral density: the Japanese Population-based Osteoporosis (JPOS) Cohort Study. Osteoporosis International, 32(11), 2289–2299.
  46. Grassi L, Väänänen SP, Ristinmaa M, et al. Prediction of femoral strength using 3D finite element models reconstructed from DXA images: validation against experiments. Biomechanics and Modeling in Mechanobiology, 16(3).
  47. Grassi L, Fleps I, Sahlstedt H, et al. (). Validation of 3D finite element models from simulated DXA images for biofidelic simulations of sideways fall impact to the hip. Bone, 142.
  48. Grassi L, Väänänen SP, Jehpsson L, et al. (). 3D Finite Element Models Reconstructed From 2D Dual‐Energy X‐Ray Absorptiometry (DXA) Images Improve Hip Fracture Prediction Compared to Areal BMD in Osteoporotic Fractures in Men (MrOS) Sweden Cohort. Journal of Bone and Mineral Research, 38(9).
  49. Grassi L, Väänänen SP, Voss A, et al. DXA-based 3D finite element models predict hip fractures better than areal BMD in elderly women. Bone. 2025;195:117457.
  50. Allison SJ, Poole KES, Treece GM, et al. (2015). The Influence of High-Impact Exercise on Cortical and Trabecular Bone Mineral Content and 3D Distribution Across the Proximal Femur in Older Men: A Randomized Controlled Unilateral Intervention. Journal of Bone and Mineral Research, 30(9), 1709–1716.
  51. Whitmarsh T, Fritscher KD, Humbert L, et al. (2011). Hip fracture discrimination using 3D reconstructions from Dual-energy X-ray Absorptiometry. 2011 IEEE International Symposium on Biomedical Imaging: From Nano to Macro, 1189–1192.
  52. Winzenrieth R, Ominsky M, Wang Y, et al. (2021). Differential effects of abaloparatide and teriparatide on hip cortical volumetric BMD by DXA-based 3D modeling. Osteoporosis International, 32(3), 575–583.
  53. England JR, Cheng PM (2019). Artificial Intelligence for Medical Image Analysis: A Guide for Authors and Reviewers. American Journal of Roentgenology, 212(3), 513–519.
  54. Lewiecki EM, Betah D, Humbert L, et al. (2024). 3D-modeling from hip DXA shows improved bone structure with romosozumab followed by denosumab or alendronate. Journal of Bone and Mineral Research, 39(4), 473–483.
  55. Winzenrieth R, Kostenuik P, Boxberger J, et al. (2022). Proximal Femur Responses to Sequential Therapy With Abaloparatide Followed by Alendronate in Postmenopausal Women With Osteoporosis by 3D Modeling of Hip Dual‐Energy X‐Ray Absorptiometry (DXA). JBMR Plus, 6(4).
  56. Winzenrieth R, Humbert L, Boxberger JI, et al. (2022). Abaloparatide Effects on Cortical Volumetric BMD and Estimated Strength Indices of Hip Subregions by 3D-DXA in Women With Postmenopausal Osteoporosis. Journal of Clinical Densitometry, 25(3), 392–400.
  57. Bennett C, Miller M, Wolford G (2009). Neural correlates of interspecies perspective taking in the post-mortem Atlantic Salmon: an argument for multiple comparisons correction. NeuroImage, 47, S125.
  58. Poole KE, Treece GM, Gee AH, et al. (2014). Denosumab Rapidly Increases Cortical Bone in Key Locations of the Femur: A 3D Bone Mapping Study in Women With Osteoporosis. Journal of Bone and Mineral Research, 30(1), 46–54.
  59. Sato M, Westmore M, Ma YL, et al. (2004). Teriparatide [PTH(1–34)] Strengthens the Proximal Femur of Ovariectomized Nonhuman Primates Despite Increasing Porosity. Journal of Bone and Mineral Research, 19(4), 623–629.
  60. Hadji P, Kamali L, Thomasius F, et al. (2024). Real-world efficacy of a teriparatide biosimilar (RGB-10) compared with reference teriparatide on bone mineral density, trabecular bone score, and bone parameters assessed using quantitative ultrasound, 3D-SHAPER{\textregistered} and high-resolution peripheral computer tomography in postmenopausal women with osteoporosis and very high fracture risk. Osteoporosis International, 35(12), 2107–2116.
  61. Sone T, Ohnaru K, Sugai T, et al. (2023). The effects of abaloparatide on hip geometry and biomechanical properties in Japanese osteoporotic patients assessed using DXA-based hip structural analysis: results of the Japanese phase 3 ACTIVE-J trial. Archives of Osteoporosis, 18(1).
  62. Genant HK, Engelke K, Bolognese MA, et al. (2016). Effects of Romosozumab Compared With Teriparatide on Bone Density and Mass at the Spine and Hip in Postmenopausal Women With Low Bone Mass. Journal of Bone and Mineral Research, 32(1), 181–187.
  63. MEDICAL 3S (2021). Webinar - Use of 3D-Shaper in clinical research: state of the art and potential applications
  64. Casado Burgos E, Di Gregorio S, González Macías J, et al. (2019). Datos de referencia de mediciones óseas en modelos 3D de fémur proximal en población española cn DXA: Proyecto SEIOMM 3D-SHAPPER. Congreso SEIOMM (24º : 2019 : Gerona).
  65. Brance ML, Saravi FD, Henr{\'i}quez MM, et al. (2020). Reference Values of Three-Dimensional Proximal Femur Parameters from Bone Densitometry Images in Healthy Subjects from Argentina. World Congress on Osteoporosis, Osteoarthritis and Musculoskeletal Diseases, 372--372.
  66. Jennings I (). 3D Shaper Technology: Revolutionizing Bone Health Analysis
  67. Al-Hashimi L, Klotsche J, Ohrndorf S, et al. (2023). Trabecular Bone Score Significantly Influences Treatment Decisions in Secondary Osteoporosis. Journal of Clinical Medicine, 12(12), 4147.
  68. Food {, Administration} D (2022). 510(k) Summary: K220822
  69. Broy SB, Cauley JA, Lewiecki ME, et al. (2015). Fracture Risk Prediction by Non-BMD DXA Measures: the 2015 ISCD Official Positions Part 1: Hip Geometry. Journal of Clinical Densitometry, 18(3), 287–308.
  70. Whitmarsh T, Humbert L, Craene MD, et al. (2009). Reconstrucción de la forma del fémur y densidad mineral ósea en 3D para el diagnóstico de osteoporosis a partir de DXA
  71. Whitmarsh T, Humbert L, Del Río Barquero LM, et al. (2011). Volumetric Bone Mineral Density Estimation using a 3D Reconstruction Method from Dual-energy X-ray Absorptiometry. ASBMR 2011 Annual Meeting Abstracts and Abstract Book.
  72. Whitmarsh T, Fritscher KD, Humbert L, et al. (2011). A Statistical Model of Shape and Bone Mineral Density Distribution of the Proximal Femur for Fracture Risk Assessment. Medical Image Computing and Computer-Assisted Intervention – MICCAI 2011, 393–400.
  73. Whitmarsh T, Fritscher KD, Humbert L, et al. (2012). Hip fracture discrimination from dual-energy X-ray absorptiometry by statistical model registration. Bone, 51(5), 896–901.
  74. Martelli Y, Whitmarsh T, Humbert L, et al. (2012). A software framework for 3D reconstruction and fracture risk assessment of the proximal femur from dual-energy x-ray absorptiometry. Proceedings of VPH 2012: Virtual Physiological Human - Integrative approaches to computational biomedicine.
  75. Slart RHJA, Punda M, Ali DS, et al. (2024). Updated practice guideline for dual-energy X-ray absorptiometry (DXA). European Journal of Nuclear Medicine and Molecular Imaging, 52(2), 539–563.