Στατιστικά (και διαφήμιση) στο Διαδίκτυο
Σκοπός του μηνύματος είναι να καταδείξει οτι τόσο οι διαφημιζόμενοι όσο και οι διαφημιστές πατούν συχνότατα σε αλλοιώσιμα, ευάλωτα ή/και μη επαληθεύσιμα στοιχεία.
Αν ανήκετε σε μία από αυτές τις κατηγορίες, ίσως σας βοηθήσει να δείτε τα πράγματα λίγο πιο ρεαλιστικά.
Ενημερωτικά, έχω βρεθεί και στις δύο πλευρές (δέχομαι-βάζω διαφήμιση) αλλά και στη θέση αυτού που "μαγειρεύει" τις μετρήσεις (ας πούμε webmaster), όχι παρεμβαίνοντας στους όποιους μετρητές αλλά στηριζόμενος ακριβώς στις αδυναμίες τους.
Ας δούμε μερικές από αυτές και κατά πόσον ανταποκρίνονται στην πραγματικότητα.
Hits/accesses
Ενας άχρηστος αριθμός. Μετράει πόσες γραμμές έχει το αρχείο καταγραφής, χωρίς κανένα ποιοτικό στοιχείο.
Αν η ιστοσελίδα παραμείνει ΑΠΟΛΥΤΩΣ ΙΔΙΑ για ένα μετρούμενο διάστημα, χρησιμεύει σαν συκγκριτικό στοιχείο για τα μεσοδιαστήματα.
Πρακτικά αυτό δε συμβαίνει ποτέ.
Σε καμμία περίπτωση δεν αποτελεί στοιχείο σύγκρισης μεταξύ δύο διαφορετικών ιστοσελίδων.
Bandwidth
Ενας αριθμός που χρησιμεύει κυρίως για να ξέρει ο κάτοχος της ιστοσελίδας πόσο θα πληρώσει.
Εξαρτάται από τον αριθμό των σελίδων, τον αριθμό των εμφανίσεων (pageviews), τον όγκο των εικόνων, τις τυχόν τεχνικές συμπίεσης κλπ.
Σε καμμία περίπτωση δεν αποτελεί στοιχείο σύγκρισης μεταξύ δύο διαφορετικών ιστοσελίδων.
Unique IPs
Είναι οι μοναδικές IP διευθύνσεις που έχουν καταγραφεί στο σχετικό αρχείο.
Ενας πολύ καλός και πρόσφορος για συγκρίσεις αριθμός, με την προϋπόθεση οτι αναφέρεται σε δεδομένο χρόνο και εφόσον έχει αφαιρεθεί η "εσωτερική κατανάλωση".
Κατά τη γνώμη μου, ο μόνος πραγματικά αξιόπιστος αριθμός (εφόσον δεν έχει μεσολαβήσει μαγείρεμα φυσικά). Αν έχετε και ποιοτικά χαρακτηριστικά (χώρες κλπ), ακόμα καλύτερα.
Pageviews
Ενας πολύ ωραίος αριθμός, που αναφέρεται στον αριθμό εμφανίσεων των σελίδων περιεχομένου.
Προσφέρεται για εσωτερική κυρίως κατανάλωση, αφού ο κάθε κατασκευαστής σελίδας μπορεί να την υλοποιήσει κατά τρόπο που μία πλήρης εμφάνιση να καταγράφεται σαν μία ή είκοσι εμφανίσεις.
Επειδή είναι αδύνατον να γνωρίζετε ΤΙ και ΠΩΣ έχει μαγειρέψει ο κάθε κατασκευαστής και επειδή αυτό μπορεί να αλλάξει ανά πάσα στιγμή, χωρίς καμμία αλλαγή σε αυτό που βλέπετε σαν "ιστοσελίδα", δεν προσφέρεται για συγκρίσεις.
Μόνη περίπτωση για σύγκριση μεταξύ διαφορετικών ιστοσελίδων είναι να ζητήσει κανείς τις εμφανίσεις ενός συγκεκριμένου και απογυμνωμένου (χωρίς παρελκόμενα) αρχείου (όχι ιστοσελίδας, προσοχή - επιλεγμένου μέρους ιστοσελίδας). Αυτό όμως απαιτεί κάποιον ειδικό, τόσο για να βρει τι θα ζητήσει κανείς όσο και για να εκτιμήσει και συγκρίνει τους αριθμούς.
Visitors, visits-sessions, time spent
Ο αριθμός υποτίθεται οτι μετράει αριθμό επισκεπτών και επισκέψεων σε δεδομένη ιστοσελίδα, για δεδομένο χρονικό διάστημα.
Συνήθως είναι μια σύμβαση (και ως ένα βαθμό αυθαιρεσία) και όχι ένας απόλυτος αριθμός:
- ο ένας κατασκευαστής δέχεται οτι "αν σε διάστημα 20 λεπτών έχω κλήση από τον παράγοντα Χ, τότε πρόκειται για τον ίδιο επισκέπτη που συνεχίζει".
- ο άλλος κατασκευαστής δέχεται οτι "αν σε διάστημα 30 λεπτών έχω κλήση από τον παράγοντα Ψ, τότε πρόκειται για τον ίδιο visitor αλλά για διαφορετικό, νέο visit".
Επειδή ΑΝ ξέραμε αυτούς τους αριθμούς, όλοι θα ήμασταν πολύ ευτυχισμένοι, έχουν αναπτυχθεί διάφορα συστήματα μέτρησης. Ολα όμως έχουν μικρότερα ή μεγαλύτερα προβλήματα, συμβάσεις και ανάλογες αποκλίσεις από την αλήθεια.
Τα πιο καλά συστήματα, επικοινωνούν με την ιστοσελίδα, όσο αυτή είναι ενεργή στον browser, ενημερώνοντας το καταγραφικό αρχείο οτι ο επισκέπτης παραμένει ίδιος και η περιήγησή του συνεχίζεται.
Ακόμα κι αυτά βέβαια έχουν σοβαρά προβλήματα:
- αν έχω τον browser καλυμμένο με ένα άλλο κείμενο, είμαι visitor εκείνη την ώρα ή όχι;
- αν κάτσει κάποιος άλλος στον υπολογιστή μου και συνεχίσει, είμαι ο ίδιος visitor και ο χρόνος μετράει;
- αν διακόψω τη σύνδεση στο δικτυο (επειδή πχ το κείμενο είναι μεγάλο και θέλω χρόνο να το διαβάσω) και μετά από δύο ώρες επιστρέψω και συνεχίσω, πολλά συστήματα με μετράνε σαν νέο visitor.
- αν, διαβάζοντας μια σελίδα, ανοίξω σε νέο παράθυρο μια παραπομπή, ποιανού visitor είμαι;
- αν ανοίξω την παραπομπή στο μέσον ενός κειμένου και μετά επιστρέψω για το υπόλοιπο;
- αν ταυτόχρονα κάνω τσατ ενώ διαβάζω μια σελίδα; αν η σελίδα ξεχαστεί ανοιχτή αλλά εγώ κάνω τσατ;
Ολα αυτά ισχύουν και στις μετρήσεις του "χρόνου παραμονής" - είναι μια σύμβαση, που πολλοί αποδέχονται, ελλείψει καλύτερης μεθόδου. ΔΕΝ είναι κάποιος απόλυτα μετρήσιμος αριθμός που δεν επιδέχεται αμφισβήτιση, αφού στηρίζεται σε αυτοματισμούς που με τη σειρά τους βασίζονται σε συμβάσεις.
Μόνο σε περιτπώσεις διαδραστικών sites μπορούμε με σχετική ασφάλεια να μιλάμε για χρόνους, επειδή απαιτούν κάποιο κλικ (επιλεγόμενη από τον χρήστη ενέργεια) για να συνεχίσει κανείς, οπότε μετράμε από ενέργεια σε ενέργεια. Πάλι βέβαια άλλου τύπου αποτελέσματα θα δώσει μια περιπέτεια (adventure), ένα σκάκι ή το google.
Γιατί είναι τόσο σημαντική η Alexa, το Netratings, το toprankings κλπ;
Πολύ απλά, γιατί αυτοί προσφέρουν τις ποιοτικά καλύτερες μετρήσεις - όχι όμως την αλήθεια.
Ολοι στηρίζονται στην υπόθεση που λέει "αν κάνει λάθος, κάνει το ίδιο λάθος για όλους", το οποίο όμως επίσης γνωρίζουν οτι είναι σε ένα βαθμό λάθος.
Αν συγκρίνουμε το Χ Mail System (πχ Yahoo Paid) που δεν έχει διαφημίσεις με το Y που έχει (Yahoo free), θεωρώντας οτι όλα τα υπόλοιπα στοιχεία είναι απολύτως ίδια, το X θα γράψει λιγότερα sessions ΚΑΙ μικρότερους χρόνους παραμονής σε σχέση με το Y, που είναι τεχνικά σωστό μεν, αλλά το "μειώνει" διαφημιστικά.
Υπάρχουν κι άλλα λάθη φυσικά, που βασίζονται στο στατιστικό δείγμα. Ενα ερώτημα που θα έπρεπε να απασχολεί είναι "ποιός δέχεται να γίνει στατιστικό δείγμα". Πολλοί, συμφωνώ - όχι όμως όλοι. Για μένα, το στατιστικό δείγμα είναι απλώς ένα υποσύνολο όσων που δέχονται να είναι στατιστικά δείγματα. Εσείς βάλατε (πχ) Alexa Toolbar; Το έβαλα δοκιμαστικά για μια βδομάδα, στα πλαίσια μιας έρευνας - διαπίστωσα σημαντικές καθυστερήσεις και άλλα προβλήματα στο σύστημά μου και προφανώς το έβγαλα αμέσως μετά το τέλος της έρευνας.
Σε ποιά σελίδα είναι καλύτερα να βάλω banner;
Βάλτε ένα όμοιο banner, στην ίδια θέση, στις προς σύγκριση ιστοσελίδες, μέσω μιας αξιόπιστης εταιρίας εξυπηρέτησης και μετρήστε τα αποτελέσματά σας.
Λάβετε υπόψη τον παράγοντα χρόνο και τυχόν ποιοτικές διαφορές των σελίδων (άλλοι έχουν κίνηση το Σ/Κ και άλλοι τις καθημερινές, άλλοι το πρωί και άλλοι το βράδυ, άλλοι έλκουν περισσότερο τις νεαρές ηλικίες κλπ).
Συνεχίστε με τη σελίδα που σας έδωσε τα καλύτερα συνολικά αποτελέσματα, σε σχέση πάντα με το στόχο που θέσατε (αναγνωρισιμότητα, πωλήσεις, οτιδήποτε).
Στην ανάγκη, συμβουλευθείτε έναν ειδικό (για μικρές δαπάνες μάλλον δεν σας συμφέρει αυτό).
Προφανώς υπάρχουν πάρα πολλά στοιχεία ακόμα που προσφέρονται, από referers και search engines μέχρι μέγεθος οθόνης. Δεν κάνω διατριβή, έδωσα απλά μερικά χτυπητά παραδείγματα για τα προβλήματα που έχουν οι μετρήσεις στο δίκτυο. Κατά τη γνώμη μου, η καλύτερη δουλειά είναι το data mining, με βάση τα log files και με την προϋπόθεση οτι οι ιστοσελίδες έχουν στηθεί κατά τρόπο που να υποβοηθούν τις μετρήσεις και τις αναλύσεις. Δυστυχώς δεν είναι και ό,τι πιο χρηστικό.