Νέος αλγόριθμος ανιχνεύει… ψεύτικα reviews!

Αποφασίσατε να αγοράσετε ένα προϊόν από ένα online κατάστημα, αλλά κάτι δεν σας “κάνει κλικ” – και τα reviews του, και καλά “από πραγματικούς κατόχους” του, σας φαίνονται… “κάπως”; Ένας νέος αλγόριθμος αναλαμβάνει να αναλύσει και μαντέψει αν τα reviews που συναντούμε στο Internet είναι πραγματικά, ή αποτελούν διαφήμιση “καμουφλαρισμένη” ως απόψεις πραγματικών καταναλωτών.

Το πείραμα

Ερευνητές στο Πανεπιστήμιο του Cornell κατέφυγαν στην Mechanical Turk, μια εταιρεία της Amazon που παρέχει τις υπηρεσίες συντακτών σε όποιον ενδιαφέρεται για “μαζική παραγωγή άρθρων”, από την οποία και ζήτησαν να τους παράσχει 400 θετικά αλλά ψεύτικα reviews ξενοδοχείων στο Chicago. “Θετικά” όπως “Ω, πέρασα υπέροχα στο πολύ καλό ξενοδοχείο Τρία Ζ” και “ψεύτικα” όπως “αυτός που τα έγραφε δεν είχε πατήσει πόδι στο συγκεκριμένο ξενοδοχείο που και-καλά παρουσίαζε”.

Στη συνέχεια, τα ανάμειξαν με 400 θετικά reviews από το TripAdvisor, τα οποία είχαν εκτιμήσει ως πραγματικά. Τέλος, έδωσαν το “μείγμα” σε τρεις ανθρώπους για να τα ξεχωρίσουν σε αληθινά και ψεύτικα. Δεν τα κατάφεραν.

Έτσι, η ομάδα ανέπτυξε έναν αλγόριθμο που κατορθώνει να κάνει (με ποσοστό επιτυχίας περίπου 90%) αυτό που δεν μπορεί να κάνει ο ίδιος ο άνθρωπος: να ξεχωρίζει τα ψεύτικα και… “απατηλά” reviews από τα πραγματικά. Ο έξυπνα σχεδιασμένος αλγόριθμος αναζητά συγκεκριμένες “δομές” στις παρουσιάσεις, στα reviews που εκτιμά, βάσει των αναλύσεων των κειμένων που ολοκλήρωσε η ομάδα του Cornell. Τα ευρήματα της – και τα “κριτήρια” του αλγόριθμου; Ιδού:

Source:

So the team developed an algorithm to distinguish fake from real, which worked about 90 percent of the time. The fakes tended to be a narrative talking about their experience at the hotel using a lot of superlatives, but they were not very good on description. Naturally: They had never been there. Instead, they talked about why they were in Chicago. They also used words like “I” and “me” more frequently, as if to underline their own credibility.

...γνωστός και ως Οδυσσέας Κουράφαλος, αρχικός υπεύθυνος για το unregistered. Συντάκτης, γραφίστας, "μαλτιμηντιάς", φανατικός της science fiction και των αστείων γατιών στου ιντερνέτ. "Δηλώνω graphics whore" (παίζω Ms. Pac-Man στο MAME με 2xSAL και το πρώτο Max Payne με FXAA antialiasing). Load "unreg*",8,1.