Δεν είναι λίγες οι φορές που ακούμε στο industry τους όρους “Correlation” και “Causation”.
Αν και αυτοί οι δύο όροι προέρχονται από την επιστήμη της Στατιστικής, η αναφορά τους είναι συχνή σε πολλές εφαρμογές του κλάδου, π.χ. Digital Marketing, Performance Marketing, Ecommerce, Marketing, Data Science, Analytics κ.α., εφόσον χρησιμοποιούνται για τη συσχέτιση μιας αιτίας με ένα αποτέλεσμα, ή ενός αποτελέσματος με ένα άλλο αποτέλεσμα.
Ξεφεύγουμε λίγο από τη συνηθισμένη θεματολογία του www.grow-digital.gr και πάμε να θίξουμε ένα θέμα που συχνά μπερδεύει.
Τι είναι το Correlation: Στη στατιστική είναι το μέτρο του βαθμού στον οποίο δύο μεταβλητές κινούνται σε σχέση μεταξύ τους. Ένα παράδειγμα συσχέτισης είναι η ιδέα ότι «Καθώς ανεβαίνει η θερμοκρασία, αυξάνονται και οι πωλήσεις παγωτού». Είναι σημαντικό να θυμάσαι ότι η συσχέτιση δεν σημαίνει ότι ένα γεγονός προκαλεί ένα άλλο. Ωστόσο, δείχνει ότι έχουν ένα μοτίβο ή μια σχέση μεταξύ τους. Εάν η μία μεταβλητή ανεβαίνει και η άλλη μεταβλητή ανεβαίνει επίσης, είναι θετική συσχέτιση. Εάν η μία μεταβλητή ανεβαίνει και η άλλη μειώνεται, είναι αρνητική ή αντίστροφη συσχέτιση. Εάν μια μεταβλητή ανεβαίνει και η άλλη μεταβλητή παραμένει περίπου η ίδια, δεν υπάρχει συσχέτιση
Τι είναι το Causation: Aναφέρεται στην ιδέα ότι ένα γεγονός οδηγεί σε ένα συγκεκριμένο αποτέλεσμα. Για παράδειγμα, όταν χτυπάει κεραυνός, ακούμε τον κεραυνό (ηχητικό κύμα) που προκαλείται από τη θέρμανση και ψύξη του αέρα από τον κεραυνό. Ο κεραυνός προκαλεί βροντή.
Ποια είναι η σημαντική διαφορά μεταξύ Correlation και Causation
Όταν βγάζεις συμπεράσματα από την ανάλυση δεδομένων, πρέπει να βεβαιωθείς ότι δεν υποθέτεις μια αιτιώδη σχέση μεταξύ των στοιχείων των δεδομένων σου όταν υπάρχει μόνο συσχέτιση. Όταν τα δεδομένα σου δείχνουν ότι η εξωτερική θερμοκρασία και η κατανάλωση παγωτού αυξάνονται ταυτόχρονα, μπορεί να είναι δελεαστικό να συμπεράνεις ότι ο ζεστός καιρός κάνει τους ανθρώπους να τρώνε παγωτό.
Ωστόσο, μια πιο προσεκτική εξέταση των δεδομένων θα αποκάλυπτε ότι κάθε αλλαγή στη θερμοκρασία δεν οδηγεί σε αλλαγή στις πωλήσεις παγωτού. Επιπλέον, μπορεί να υπήρχε πώληση παγωτού την ίδια στιγμή που συλλέγονταν τα δεδομένα, κάτι που μπορεί να μην είχε ληφθεί υπόψη στην ανάλυσή σου.
Η γνώση της διαφοράς μεταξύ Correlation και Causation είναι σημαντική όταν βγάζεις συμπεράσματα από τα δεδομένα σου, καθώς το ρίσκο για λάθος απόφαση μπορεί να είναι υψηλό.
Ας δούμε δύο ακόμη παραδείγματα δείχνουν αντίστοιχες περιπτώσεις στην υγεία και τις ανθρώπινες υπηρεσίες.
Αιτία μιας ασθένειας
Για παράδειγμα, η πελλάγρα είναι μια ασθένεια με συμπτώματα ζάλης, πληγών, εμετού και διάρροιας. Στις αρχές του 1900, οι άνθρωποι πίστευαν ότι η ασθένεια προκλήθηκε από ανθυγιεινές συνθήκες διαβίωσης. Οι περισσότεροι άνθρωποι που έπαθαν πελλάγρα ζούσαν επίσης σε ανθυγιεινά περιβάλλοντα. Όμως, μια πιο προσεκτική εξέταση των δεδομένων έδειξε ότι η πελλάγρα ήταν αποτέλεσμα έλλειψης νιασίνης (βιταμίνη Β3). Οι ανθυγιεινές συνθήκες σχετίζονταν με την πελλάγρα, επειδή οι περισσότεροι άνθρωποι που δεν είχαν την οικονομική δυνατότητα να αγοράσουν τρόφιμα πλούσια σε νιασίνη επίσης δεν είχαν την οικονομική δυνατότητα να ζήσουν σε πιο υγιεινές συνθήκες. Όμως, οι κακές συνθήκες διαβίωσης αποδείχτηκε ότι ήταν μόνο ένας συσχετισμός (correlation).
Απόκτηση ειδικών προνομιών
Εδώ είναι ένα άλλο παράδειγμα. Ας υποθέσουμε ότι εργάζεσαι για μια κρατική υπηρεσία που παρέχει ορισμένα προνόμια. Παρατήρησες από το Google Analytics της εταιρείας ότι τα άτομα που πληρούν τις προϋποθέσεις για τα προνόμια περιηγούνται στον επίσημο website, αλλά το εγκαταλείπουν χωρίς να εγγραφούν για να πάρουν οφέλη. Πιστεύεις ότι τα άτομα που επισκέπτονται το website φεύγουν επειδή δεν βρίσκουν τις πληροφορίες που χρειάζονται για να εγγραφούν στα προνόμια. Το Google Analytics μπορεί να σε βοηθήσει να βρείτε ενδείξεις (correlations), όπως τα ίδια άτομα που επιστρέφουν πολλές φορές ή πόσο γρήγορα φεύγουν οι χρήστες από τη σελίδα. Ένας από αυτούς τους συσχετισμούς μπορεί να σε οδηγήσει στην πραγματική αιτία, αλλά θα χρειαστεί να συλλέξεις πρόσθετα δεδομένα, όπως σε μια έρευνα, για να γνωρίζεις ακριβώς γιατί τα άτομα που έρχονται στο website δεν εγγράφονται για τα προνόμια. Μόνο τότε μπορείτε να καταλάβεις πώς να αυξήσεις το subscription rate.
Η εφαρμογή Correlation και Causation στο Performance Marketing
Έχοντας πλέον inspiration από τα προηγούμενα παραδείγματα, ξεκινάει να γίνεται αντιληπτή οι εφαρμογή των correlation και causation στο performance marketing.
Για παράδειγμα, η πτώση στο ROAS ή στο Conversion Rate σε μια landing page με προϊόντα αθλητικά παπούτσια, με παράλληλη αύξηση στο CPC, δεν σημαίνει απαραίτητα ότι αυξήθηκε ο ανταγωνισμός ο οποίος οδήγησε μέσω της αύξησης του CPC στην πτώση των άλλων δύο (θα ήταν μια ασφαλής εκτίμηση).
Η παραπάνω εκτίμηση θα μπορούσε να αποτελεί ένα correlation.
Το causation όμως, θα μπορούσε να είναι μια κατάσταση Out of Stock σε ταχυκίνητα νούμερα παπουτσιών (π.χ. 40-44), η οποία οδηγεί τους χρήστες στο να μη βρίσκουν τα νούμερα που θέλουν και έτσι να εγκαταλείπουν τη σελίδα.
Είναι πολλές οι φορές, στο Performance Marketing και όχι μόνο, όπου προκύπτουν πολύ γρήγορα συμπεράσματα για συσχετίσεις μετρήσεων που βλέπουμε μέσα στις πλατφόρμες, χωρίς όμως να υπολογίζουμε αιτίες και καταστάσεις που επηρεάζουν το αποτέλεσμα.
Έτσι, καταλήγουμε σε correlations (σωστά και μη), αγνοώντας τα causations. Αυτή η συνεχής διαδικασία μπορεί να αποτελέσει σημαντικό ρίσκο για την απόδοση όχι μόνο των καμπανιών και της διαφημιστικής επένδυσης, αλλά και της γενικότερης απόδοσης του brand.
Τι θα πρέπει να προσέχεις και να θυμάσαι κατά τη διαδικασία της ανάλυσης δεδομένων:
- Ανέλυσε διεξοδικά τυχόν συσχετισμούς που βρίσκεις, πρόσθεσε κριτική σκέψη και λογική.
- Εξέτασε το πλαίσιο των δεδομένων για να προσδιορίσετε εάν το causation έχει νόημα (και μπορεί να υποστηριχθεί από όλα τα δεδομένα)
- Κατανόησε τους περιορισμούς των εργαλείων που χρησιμοποιείς για ανάλυση