Σύνοψη

  • Το 50% των ιατρικών συμβουλών που παρέχονται από μοντέλα Τεχνητής Νοημοσύνης χαρακτηρίζονται από ελαφρώς έως εξαιρετικά προβληματικές.
  • Το Grok της xAI σημείωσε το υψηλότερο ποσοστό λαθών (58%), ακολουθούμενο από το ChatGPT (52%) και το Meta AI (50%).
  • Κανένα chatbot δεν κατάφερε να παράγει μια πλήρως ακριβή λίστα ιατρικών πηγών, επινοώντας συχνά ανύπαρκτες έρευνες και συγγραφείς.
  • Ενώ τα μοντέλα μπορούν θεωρητικά να βρουν τη σωστή απάντηση στο 95% των περιπτώσεων, οι χρήστες καταλήγουν στο σωστό συμπέρασμα μόλις στο 35% του χρόνου λόγω κακής ερμηνείας.
  • Η ακρίβεια των AI μοντέλων εκτοξεύεται άνω του 90% μόνο όταν αναλύουν ήδη υπάρχοντα εργαστηριακά αποτελέσματα, ενώ καταρρέουν (80% αποτυχία) στη διάγνωση βασικών συμπτωμάτων.

Η αναζήτηση ιατρικών συμπτωμάτων στο διαδίκτυο αποτελεί εδώ και δύο δεκαετίες μια πάγια συνήθεια των χρηστών, συχνά με καταστροφικά αποτελέσματα για την ψυχολογία τους. Ωστόσο, η μετάβαση από τις παραδοσιακές μηχανές αναζήτησης στα Μεγάλα Γλωσσικά Μοντέλα (LLMs) δημιουργεί ένα εντελώς νέο, σημαντικά πιο περίπλοκο τοπίο. 

Μια νέα, εκτενής επιστημονική μελέτη καταρρίπτει τον μύθο της αλγοριθμικής αυθεντίας στην υγεία, αποδεικνύοντας με σκληρά δεδομένα ότι η Τεχνητή Νοημοσύνη είναι, προς το παρόν, ένας εξαιρετικά αναξιόπιστος ιατρικός σύμβουλος.

Πόσο αξιόπιστες είναι οι ιατρικές συμβουλές από τα AI Chatbots;