Επί του παρόντος, τα δεδομένα που συγκεντρώνει η Δημόσια Διοίκηση δεν είναι πάντοτε εύκολα προσβάσιμα και σε πολλές περιπτώσεις, η ποιότητά τους δεν επιτρέπει την αποτελεσματική τους χρήση. Αυτό επιβάλλεται να αλλάξει με την εισαγωγή και την υιοθέτηση από το σύνολο των φορέων της κυβέρνησης μιας αναπτυξιακής εθνικής στρατηγικής για τα δεδομένα, η οποία θα είναι στοιχισμένη με την Ευρωπαϊκή Στρατηγική για τα δεδομένα[1].
Η ανοικτή διάθεση, η επαναχρησιμοποίηση και η μέγιστη αξιοποίηση των δεδομένων του Δημόσιου Τομέα αφενός θα ενισχύσει τη συμμετοχή, τη διαφάνεια και το δημόσιο έλεγχο και αφετέρου θα προωθήσει την επιχειρηματικότητα, καθώς θα εξασφαλιστεί ότι οι επιχειρήσεις, ιδίως οι νεοφυείς και όσες δραστηριοποιούνται στον τομέα των νέων τεχνολογιών, θα έχουν την απαραίτητη πρώτη ύλη, ώστε να αναπτύξουν υπηρεσίες προστιθέμενης αξίας.
Η στρατηγική στόχευση επικεντρώνεται στην ανάπτυξη δράσεων για τη σταδιακή αξιοποίηση των δεδομένων ως θεμελιώδους υποδομής και αναπτυξιακού πόρου. Η εκκίνηση δίνεται από τα δεδομένα υψηλής αξίας (high-value data) ή αλλιώς Δεδομένα Δημόσιου Σκοπού, στη συνέχεια ακολουθούν τα δεδομένα σε επιλεγμένα θεματικά πεδία (π.χ. οικονομία και επιχειρήσεις) και ολοκληρώνεται με την αποτελεσματική αξιοποίηση δημόσιων, επιχειρηματικών και επιστημονικών δεδομένων σε μαζική κλίμακα. Η ολοκληρωμένη προσέγγιση και η διευκόλυνση της κλιμάκωσης βασίζεται στους κύκλους ζωής των δεδομένων (data life cycles) ανά θεματικό πεδίο (π.χ. υγεία, μετακινήσεις, πολιτισμός, περιβάλλον).
Σε τεχνολογικό επίπεδο, προκρίνεται η αναβάθμιση της εθνικής πύλης ανοικτών δεδομένων και η διασύνδεσή της με την ευρωπαϊκή πύλη. Σημαντική παρέμβαση αποτελεί επίσης, η υλοποίηση του ελληνικού Μητρώου Μεταδεδομένων (όπως ορίζεται στο Μητρώο Διαλειτουργικότητας) και μιας κεντρικής Πύλης Εξυπηρέτησης των Βασικών Μητρώων, η οποία θα αποτελεί κεντρικό σημείο πρόσβασης στα βασικά μητρώα της χώρας, θα παρέχει πληροφορίες γι’ αυτά και θα διευκολύνει την αναζήτηση και τη διασύνδεσή τους. Παράλληλα, όπως περιγράφεται στην ενότητα 6.7 «Θεματικά Αποθετήρια Δεδομένων», σημαντικά σύνολα δεδομένων που προέρχονται από διάφορες πηγές, όπως συστήματα αισθητήρων από έξυπνες πόλεις και έξυπνα κτίρια, συστήματα συγκοινωνιών και δημόσιων μεταφορών, αισθητήρες και μετρητές παρόχων υπηρεσιών κοινής ωφέλειας, και ψηφιακούς πόρους πολιτισμικής κληρονομιάς, θα παρέχονται μέσω θεματικών αποθετηρίων, με στόχο την υποστήριξη των επιχειρήσεων για την ανάπτυξη νέων υπηρεσιών και προϊόντων προστιθέμενης αξίας.
Οι στρατηγικοί στόχοι της πολιτικής αξιοποίησης των δεδομένων είναι οι ακόλουθοι τρεις:
- Η διακυβέρνηση των δεδομένων
- Η αξιοποίηση των δεδομένων μέσω της στατιστικής επεξεργασίας, της συνδυαστικής επεξεργασίας και των εφαρμογών big data analytics και της τεχνητής νοημοσύνης.
- Η ασφάλεια και προστασία των προσωπικών δεδομένων σύμφωνα και με το GDPR και τις λοιπές ισχύουσες διατάξεις.
Οι ανωτέρω στόχοι θα εξυπηρετηθούν από την στρατηγική δεδομένων η οποία θα στηριχθεί στους πέντε βασικούς άξονες ενός Μοντέλου Διακυβέρνησης των Δεδομένων, ήτοι: Διοίκηση, Νομοθεσία, Πολιτική, Τεχνολογία & Πρότυπα και Ικανότητες. Ο άξονας δράσεων για τη διοίκηση των δεδομένων στοχεύει αρχικά στη δημιουργία κρίσιμης μάζας και στη συνέχεια, στη μαζική διάθεση κυβερνητικών δεδομένων, στη θεματική εμβάθυνση σε επιμέρους κλάδους και στην αξιοποίηση ευρωπαϊκών πρωτοβουλιών και έργων. Όσον αφορά στην εξασφάλιση του απαιτούμενου νομοθετικού υπόβαθρου, οι νομοθετικές παρεμβάσεις θα εστιάσουν στη θεσμοθέτηση των Δεδομένων Δημόσιου Σκοπού που θα έχουν προσδιοριστεί και στον εκσυγχρονισμό του νομοθετικού πλαισίου με βάση τη σχετική οδηγία. Παράλληλα, θα αναπτυχθεί η εθνική πολιτική δεδομένων με άμεση προτεραιότητα τη δημοσίευση και την αξιοποίηση των Δεδομένων Δημόσιου Σκοπού. Όσον αφορά την ανάπτυξη απαιτούμενων Προτύπων και Τεχνολογικών Λύσεων, η στόχευση εστιάζει στην αξιοποίηση διεθνών και ευρωπαϊκών προτύπων για τα δεδομένα, στον προσδιορισμό αυστηρών κανόνων για τη συγκέντρωση και διαχείριση των δεδομένων από κάθε φορέα του Δημόσιου Τομέα και στην εξασφάλιση σημασιολογικής και τεχνικής διαλειτουργικότητας συστημάτων του Δημοσίου μέσα από την ανταλλαγή δεδομένων. Σημαντική είναι επίσης, η υλοποίηση εφαρμογής συνδυασμού, σύγκρισης και οπτικοποίησης των δεδομένων (visualization layer) που θα τα καθιστά πιο εύχρηστα. Στην κατεύθυνση ανάπτυξης ικανοτήτων στο πεδίο των ψηφιακών δεδομένων, ο σχεδιασμός περιλαμβάνει την υλοποίηση εθνικών δράσεων εκπαίδευσης και διάδοσης των ανοιχτών δεδομένων και την ένταξη εκπαιδευτικών προγραμμάτων για την ανάπτυξη ικανοτήτων στα δεδομένα σε όλες τις εκπαιδευτικές βαθμίδες.
Στον παρακάτω πίνακα παρουσιάζεται μια ενδεικτική καταγραφή προτεινόμενων έργων για την υλοποίηση της στρατηγικής δεδομένων ανοικτού χαρακτήρα στο δημόσιο τομέα η οποία δεν έχει εξαντλητικό χαρακτήρα.
6.6.1. Έργα
Διαμόρφωση του Μοντέλου Διακυβέρνησης των Δεδομένων σε εθνικό επίπεδο
Το μοντέλο θα καθορίσει τις ακολουθούμενες πολιτικές για τη διαχείριση και ανοικτή διάθεση των δεδομένων του δημόσιου τομέα. Το μοντέλο θα αποτελεί την πυξίδα για τις ακολουθούμενες πολιτικές και θα συνεισφέρει στην καλύτερη αξιολόγησή τους τόσο από την κυβέρνηση και τους πολίτες όσο και από τους διεθνείς οργανισμούς. Ο προσδιορισμός του Μοντέλου Διακυβέρνησης των Δεδομένων θα υποστηρίζεται από μελέτες για τη διαχείριση και τη διάθεση δεδομένων σε θεματικούς τομείς. Μεσοπρόθεσμα, θα επιδιωχθεί η αξιοποίηση των δεδομένων σε μαζική κλίμακα.
Σχεδίαση και υλοποίηση της Εθνικής Πύλης Ανοικτών Δεδομένων
Σχεδίαση και υλοποίηση της Εθνικής Πύλης Ανοικτών Δεδομένων, η οποία θα αποτελέσει τη μετεξέλιξη του κεντρικού αποθετηρίου δημόσιων δεδομένων data.gov.gr, το οποίο θα βελτιωθεί ακολουθώντας συστάσεις και βέλτιστες πρακτικές από αντίστοιχα συστήματα στην Ευρωπαϊκή Ένωση, όπως για παράδειγμα την ευρωπαϊκή πύλη για τα ανοικτά δεδομένα (European Data Portal). Η παρέμβαση θα περιλαμβάνει επίσης, σύστημα δημοσιοποίησης και οπτικοποίηση συνόλων δεδομένων και θα συμπληρωθεί από την ανάπτυξη πιλοτικών εφαρμογών προστιθέμενης αξίας που αξιοποιούν σημαντικά σύνολα δεδομένων (Δεδομένα Δημόσιου Σκοπού).
Διαμεσολαβητής Περιεχομένου
O Διαμεσολαβητής Περιεχομένου (Content Mediator) είναι μια αρχιτεκτονική αφαίρεση (architectural abstraction) και μπορεί να υλοποιηθεί είτε μέσω ανοικτών προτύπων (open standards) ανταλλαγής δεδομένων ή ως ένα πραγματικό πληροφοριακό σύστημα, υποστηριζόμενο από ένα επίπεδο επιχειρησιακής λογικής (π.χ. σε μορφή κανόνων ή διαδικασιών). Η ανταλλαγή δεδομένων μέσω του Διαμεσολαβητή Περιεχομένου επιτρέπει στους οργανισμούς να ανταλλάσσουν πληροφορίες μέσω μιας αρθρωτής λύσης, η οποία είναι ασφαλής και εύκολη στη χρήση. Αποτελεί ένα τυποποιημένο, συνεκτικό, συνεργατικό, διαλειτουργικό και ασφαλές επίπεδο ανταλλαγής δεδομένων που παρέχει στους φορείς της δημόσιας διοίκησης την ευκαιρία να αναπτύξουν υπηρεσίες που απευθύνονται σε πολίτες, επιχειρήσεις και δημόσιους υπαλλήλους. Η δημιουργία οντοτήτων που συνδυάζουν πολλές διαφορετικές υπηρεσίες και πηγές δεδομένων είναι εύκολη και οικονομικά αποδοτική.
Ο Διαμεσολαβητής Περιεχομένου βελτιώνει την ποιότητα των υφιστάμενων υπηρεσιών, ενεργοποιεί νέους τύπους καινοτόμων υπηρεσιών, εξοικονομεί κόστη σε υποδομές, αρχειοθέτηση, κ.ά., ενισχύει την ασφάλεια δεδομένων και την προστασία των προσωπικών δεδομένων, υποστηρίζει εύκολη πρόσβαση δεδομένων μέσω διεπαφών – μετά τη σύνδεση όλων των υπηρεσιών που είναι διαθέσιμες και εξασφαλίζει την εμπιστευτικότητα, την ακεραιότητα και τη διαλειτουργικότητα μεταξύ των φορέων που ανταλλάσσουν δεδομένα.
Για την υποστήριξη και τη διευκόλυνση της ανταλλαγής δεδομένων, ο Διαμεσολαβητής Περιεχομένου υλοποιεί μια σειρά από κοινά χαρακτηριστικά, όπως είναι η διαχείριση διευθύνσεων (φορέων), η δρομολόγηση μηνυμάτων, η διαχείριση δικαιωμάτων πρόσβασης, η πιστοποίηση σε επίπεδο οργανισμού, η πιστοποίηση σε επίπεδο μητρώου και πληροφοριακού συστήματος, η κρυπτογράφηση των δεδομένων, η χρονοσφραγίδα, η ψηφιακή υπογραφή μηνυμάτων, κ.ά..
Αυτή η υλοποίηση αποτελεί βασική συνιστώσα ψηφιακών υποδομών στην Ελλάδα και επιτρέπει τη μετάβαση από τη διαλειτουργικότητα μεταξύ δύο φορέων στην ενημέρωση των αντίστοιχων Μητρώων ύστερα από κάθε αλλαγή στα δεδομένα των πολιτών/ επιχειρήσεων.
Σύστημα πρόσβασης χρηστών και διαχείρισης των προσωπικών τους στοιχείων μέσω του gov.gr
Σχεδιασμός και υλοποίηση συστήματος για πρόσβαση πιστοποιημένων χρηστών στα προσωπικά τους δεδομένα μέσω του gov.gr αλλά και του συστήματος διαχείρισης των σχέσεων με τους πολίτες (Citizen Relationship Management), όπου ο πολίτης θα έχει πλήρη εικόνα των προσβάσεων δημοσίων οργάνων στα προσωπικά του δεδομένα και τη δυνατότητα άσκησης των δικαιωμάτων του σύμφωνα με τον GDPR και τις λοιπές ισχύουσες διατάξεις.
Δημιουργία του Ελληνικού Μητρώου Μεταδεδομένων (ΕΜΜΔ)
Ανάπτυξη κεντρικού ΕΜΜΔ, το οποίο θα παρέχει πρόσβαση σε ένα κοινά αποδεκτό αποθετήριο. Η υλοποίηση του ελληνικού Μητρώου Μεταδεδομένων και μιας κεντρικής Πύλης Εξυπηρέτησης των Βασικών Μητρώων, η οποία θα αποτελεί κεντρικό σημείο πρόσβασης στα βασικά μητρώα της χώρας, θα παρέχει πληροφορίες γι’ αυτά και θα διευκολύνει την αναζήτηση και τη διασύνδεσή τους.
Πίνακας 3: Έργα σχετικά με την Ανοικτή Διάθεση Δεδομένων του Δημοσίου Τομέα
Πηγή: Ιδία επεξεργασία
[1]https://eur-lex.europa.eu/legal-content/EL/TXT/PDF/?uri=CELEX:52020DC0066&from=EN
Στις προβλέψεις της παρούσας ενότητας είναι καλό να ενσωματωθούν τα ευρήματα της Αναφοράς Σχεδιασμού του Ανεξάρτητου Μηχανισμού Αξιολόγησης για το 4ο Εθνικό Σχέδιο Δράσης για την Ανοικτή Διακυβέρνηση, και ειδικά η σύσταση 1 περί εθνικής στρατηγικής ανοικτών δημόσιων δεδομένων, που αναφέρει ότι
«1. Ανάπτυξη μιας εθνικής στρατηγικής ανοικτών δεδομένων σε συνεργασία με μη κυβερνητικούς ενδιαφερόμενους, η οποία ενοποιεί τα διασκορπισμένα δεδομένα, διασφαλίζει τη συμμόρφωση προς τα πρότυπα και την ποιότητα ανοικτών δεδομένων και προτεραιοποιεί τη δημοσίευση συνόλων δεδομένων υψηλής αξίας, προκειμένου να απευθύνεται σε κύρια οικονομικά, κοινωνικά και πολιτικά προβλήματα στην Ελλάδα.
Επί του παρόντος, τα δομημένα ανοικτά δημόσια δεδομένα δημοσιεύονται σε τουλάχιστον δύο διαφορετικές πύλες που αφορούν συνολικά τον δημόσιο τομέα και σε τουλάχιστον δύο επιπλέον θεματικές πύλες, ενώ τα αδόμητα ανοικτά δημόσια δεδομένα δημοσιεύονται σε τουλάχιστον τρεις διαφορετικές πύλες που αφορούν συνολικά τον δημόσιο τομέα, οδηγώντας, με τον τρόπο αυτό, σε διασκορπισμό των πόρων και πιθανές περιπτώσεις διπλασιασμού μόχθου, καθώς και σε χαμηλής ποιότητας ευρεσιμότητα των δεδομένων από την πλευρά των πολιτών και των επιχειρήσεων. Η ανατροφοδότηση που συγκεντρώθηκε από μη κυβερνητικούς ενδιαφερόμενους, και ιδιαίτερα από ακαδημαϊκούς εμπειρογνώμονες, αναφέρθηκε ρητά σε φαινόμενα χαμηλής ποιότητας ομαδοποίησης των δεδομένων από τη δημόσια διοίκηση και σε περιορισμένη συμμόρφωση προς τις καθιερωμένες οδηγίες για την ευχρηστία των ανοικτών δεδομένων. Ορισμένες κύριες συστάσεις από την προηγούμενη αναφορά του IRM, σε συνδυασμό με την οδηγία της Ευρωπαϊκής Ένωσης για τα ανοικτά δεδομένα και την επαναχρησιμοποίηση της πληροφορίας του δημόσιου τομέα, υποδεικνύουν ότι πρέπει να διασφαλιστεί πως η δημοσίευση ανοικτών δεδομένων θέτει προτεραιότητα σε σύνολα δεδομένων υψηλής αξίας, τα οποία απευθύνονται σε κύρια οικονομικά, κοινωνικά και πολιτικά προβλήματα στην Ελλάδα. Οι δημόσιοι φορείς που είναι αρμόδιοι να ενεργήσουν επί αυτής της σύστασης περιλαμβάνουν το Υπουργείο Ψηφιακής Διακυβέρνησης, όπως και το Υπουργείο Περιβάλλοντος και Ενέργειας, το οποίο έχει εξειδικευμένη εμπειρία σε γεωχωρικά δεδομένα.»
σημείωση : διευκρινίζεται ότι το σχόλιο αυτό προέρχεται από τον υποβάλλοντα (Δ.Γκούσκος, Εθνικός Ερευνητής IRM) και όχι από τον IRM/OGP.
Τα άρθρα 7, 8 και 9 του Ν. 4305/2014 δίνουν μεγάλο περιθώριο στους φορεις να μην ανοίξουν τα δεδομένα τους ή να το κάνουν με τρόπο που δεν βοηθάει την ανάπτυξη και την καινοτομία. Η διαφάνεια σε σχέση με την κοστολόγηση πρέπει να διασφαλίζεται και αυτό δεν ειναι εύκολο.
Πρέπει να αποσαφηνιστούν πολλές ειδικές περιπτώσεις και να διενεργηθούν μελέτες σκοπιμότητας σε σχεση με το άνοιγμα των δεδομένων και την κάλυψη του κόστους παραγωγής τους σε σχέση με το όφελος από την ελεύθερη διαθεση τους. Παραδείγματα αποτελούν τα δεδομένα υγείας και τα μετεωρολογικά δεδομένα.
Επίσης να τεθούν κριτήρια ποιότητας σε σχεση με την πληρότητα, τον χρόνο διάθεσης (ιδανικά σε πραγματικό χρόνο), την αξιοπιστία και φυσικά την μορφή (ψηφιακή και εύκολα επεξεργάσιμη, συνεχούς ροής).
Βέλτιστες διεθνείς πρακτικές πρέπει να καταγραφούν και να χρησιμοποιηθούν από τους φορείς και αυτοί να αξιολογούνται με βάση το πόσο ανοικτοί είναι σε σχέση με το διεθνές benchmark.
Διαφορετικά μια επιχειρηση στην Ελλάδα έχει συγκριτικό μειονέκτημα σε σχέση με μια αντίστοιχη επιχείρηση σε άλλη χώρα που έχει στην διάθεσή της πιο ποιοτικά ανοικτά δεδομένα με καλύτερους όρους και χωρις γραφειοκρατία.
Το βασικό θέμα είναι ότι ένας φορέας που ανοίγει τα δεδομένα του με σωστό τρόπο εκχωρεί πιθανά ή υπαρκτά έσοδα, υπόκειται σε επιπλέον διαχειριστικό κόστος, και πιθανόν εκχωρεί «ισχύ» και δημιουργεί στον ίδιο ανταγωνισμό από τον ιδιωτικό τομέα. Το υπαρκτό ή «αντιληπτό» αυτό κόστος θα πρέπει να αντισταθμιστεί πρακτικά και αυτό πρέπει να γίνεται κατά περίπτωση και με διαβούλευση και πάντα ακολουθώντας καλές πρακτικές.
6.6 Ανοικτά δεδομένα
Δεν διευκρινίζεται ο τρόπος διάθεσης των ανοικτών δεδομένων. Θα είναι στατικά και η ενημέρωση των σχετικών αρχείων του data.gov.gr θα γίνεται περιοδικά, ή θα είναι δυναμικά μεταβαλλόμενα;
Τα δεδομένα θα πρέπει να αναρτώνται σε μορφή που είναι εύκολα επεξεργάσιμη. Πρέπει να αποτελέσει αντιπαράδειγμα ο τρόπος ανάρτησης pdf εγγράφων στο Διαύγεια και η λειτουργικότητά του.
Προτείνεται ο κοινός και συνδυαστικός προσδιορισμός αυτών των εννοιών, καθώς και οι εύρεση εφαρμογών διασύνδεσής τους, προς μέγιστη αξιοποίηση των οφειλών τους.
Open data vs Linked data vs Metadata: Οι έννοιες αυτές, ήτοι ανοιχτά δεδομένα (open data), διασυνδεδεμένα δεδομένα (linked data) και μεταδεδομένα (metadata) θα πρέπει να οριστούν και να αξιολογηθούν από κοινού, διότι η σωστή αξιοποίησή τους και τα οφέλη που αυτά μπορούν να φέρουν στον δημόσιο ΨΜ θα προκύψουν μόνο όταν τα χειριστούμε συνδυαστικά και χρησιμοποιήσουμε εφαρμογές που ήδη έχουν αναπτυχθεί για την διασύνδεσή τους. Ενδεικτικό παράδειγμα αποτελεί το Linda Project (ID: 610565), ένα EU-funded (FP7-ICT-2013-SME-DCA) έργο που προσφέρει εργαλεία διαφανούς διασύνδεσης ανομοιογενών δεδομένων του δημοσίου τομέα, προς χρήση και αξιοποίηση από τις Μικρο-μεσαίες επιχειρήσεις ΜΜΕ).
Συνέργειες & Οικοσύστημα στην ανάλυση δεδομένων
Το Μοντέλο Διακυβέρνησης Δεδομένων και η Εθνική Πύλη Ανοικτών Δεδομένων θα πρέπει να σχεδιαστούν με βασικό στόχο την έρευνα και ανάπτυξη υπηρεσιών προστιθέμενης αξίας που βασίζονται σε λύσεις και εφαρμογές ανάλυσης δεδομένων, Μηχανικής Μάθησης, ΤΝ. Βασικός γνώμονας, λοιπόν, της ανάπτυξης της Εθνικής Πύλης Ανοικτών Δεδομένων και των αποθετηρίων δεδομένων πρέπει να είναι οι ανάγκες για αυτοματισμούς στο Δημόσιο και τις Επιχειρήσεις και γενικότερα ψηφιακές λύσεις με έξυπνο λογισμικό (όπως, για παράδειγμα, ψηφιακές υπηρεσίες υγείας επαυξημένες με χρήση ΤΝ).
Οι πιλοτικές λύσεις, εφαρμογές και ψηφιακές υπηρεσίες που αναπτύσσονται με αξιοποίηση των συνόλων δεδομένων τα οποία διατίθενται μέσω της Εθνικής Πύλης Ανοικτών Δεδομένων και γενικότερα από τα αποθετήρια δεδομένων, θα πρέπει να είναι συμβατές με τις διαδικασίες και τα εγκατεστημένα συστήματα του Δημοσίου και των Επιχειρήσεων όπου προορίζονται να ενσωματωθούν και να λειτουργήσουν. Όλες οι πιλοτικές προσπάθειες πρέπει να αποσκοπούν στην ανάπτυξη δοκιμαστικών λύσεων σε υπαρκτές επιχειρηματικές ανάγκες και προβλήματα. Αυτό μπορεί να επιτευχθεί μόνο με ενθάρρυνση και κινητοποίηση ευρύτερων συνεργειών μεταξύ επιχειρήσεων-παρόχων εφαρμογών νέας τεχνολογίας, του δημοσίου ή των επιχειρήσεων-πελατών, της ακαδημαϊκής κοινότητας, όπου οι συμμετέχοντες θα εργάζονται από κοινού ερευνώντας και αναπτύσσοντας λύσεις πάνω σε πραγματικές ανάγκες/προβλήματα, όπως αυτές προσδιορίζονται σε σχέση με τα αναλυόμενα σύνολα δεδομένων (στο Μοντέλο Διακυβέρνησης Δεδομένων).
Με αυτόν τον τρόπο καθίσταται δυνατός ο μετασχηματισμός πιλοτικών λύσεων που έχουν αναπτυχθεί πάνω σε ανοικτά σύνολα δεδομένων σε πραγματικές ψηφιακές εφαρμογές, υπηρεσίες ή προϊόντα που ενσωματώνονται και λειτουργούν στο πραγματικό περιβάλλον του δημοσίου ή μίας επιχείρησης ή προωθούνται στην αγορά. Παράλληλα, αναπτύσσεται και διαμορφώνεται ένα οικοσύστημα για τον ψηφιακό μετασχηματισμό και την ανάλυση δεδομένων που αναδεικνύει και ενεργοποιεί όλους τους ρόλους στην αλυσίδα αξίας των ψηφιακών υπηρεσιών, από την συγκέντρωση των δεδομένων και την έρευνα μέχρι την παραγωγή, τη διάθεση και την εγκατάσταση. Και η έκβαση έχει περισσότερες πιθανότητες να είναι επιτυχής γιατί με τις συνέργειες επιτυγχάνεται συνεισφορά των εμπλεκομένων σε όλα τα στάδια της αλυσίδας αξίας, από την έρευνα μέχρι την εγκατάσταση και τις μελλοντικές επεκτάσεις.
Επεξεργασία (προετοιμασία) συνόλων δεδομένων για συγκεκριμένα ερευνητικά/επιχειρηματικά προβλήματα – χαρακτηρισμός δεδομένων
Θα υπάρχει στα αποθετήρια δεδομένων πρόβλεψη & δυνατότητες/διαδικασίες προετοιμασίας (προηγούμενης επεξεργασίας – preprocessing) των δεδομένων προκειμένου τα δεδομένα να μπορούν να χρησιμοποιηθούν για συγκεκριμένους ερευνητικούς (και στη συνέχεια επιχειρηματικούς) σκοπούς (δηλαδή για επίλυση συγκεκριμένων ερευνητικών και επιχειρηματικών προβλημάτων);
Ως παράδειγμα αναφέρουμε την κοινή πρακτική στην έρευνα στην ΤΝ, όπου τροφοδοτείται η ερευνητική κοινότητα με σύνολα χαρακτηρισμένων δεδομένων, στοχευμένα σε συγκεκριμένα ερευνητικά προβλήματα. Έτσι προετοιμάζονται σύνολα από κείμενα (κάποιο συγκεκριμένο corpus, για παράδειγμα, νομικά κείμενα) χαρακτηρισμένα το καθένα με τα tags του για έρευνα στο πρόβλημα του document labeling ή εικόνες χαρακτηρισμένες με τις θέσεις των προς μελέτη αντικειμένων για έρευνα στο πρόβλημα του object detection (και τα δύο παραδείγματα αναφέρονται σε ερευνητικά και όχι επιχειρηματικά προβλήματα).
Συγκέντρωση δεδομένων & σύνθεση συνόλων δεδομένων στα θεματικά πεδία
Θα σχεδιαστούν επιμέρους δράσεις για συντονισμένη συλλογή & συγκέντρωση δεδομένων στα διάφορα θεματικά πεδία και σύνθεση συνόλων δεδομένων για συγκεκριμένες περιοχές προβλημάτων, ανά πεδίο ή διαθεματικών; Αυτό θα γίνει στα πλαίσια μετέπειτα επέκτασης του Μοντέλου Διακυβέρνησης των Δεδομένων ώστε να επεκτείνει τη διακυβέρνηση ανοικτών δεδομένων, πέραν της Διακυβέρνησης Δεδομένων Δημόσιου Σκοπού (δεδομένα υψηλής αξίας) και με δεδομένα των θεματικών πεδίων;
Προβλήματα & εφαρμογές όπου μπορεί να χρησιμοποιηθεί το κάθε ανοικτό σύνολο δεδομένων
Ο κύριος στόχος της διάθεσης των Δεδομένων Δημόσιου Σκοπού (δεδομένων υψηλής αξίας) και (σε μετέπειτα στάδιο) των δεδομένων σε επιλεγμένα θεματικά πεδία (μεταφορές, ενέργεια, περιβάλλον, κοκ) είναι να αξιοποιηθούν αποτελεσματικά από επιχειρήσεις που δραστηριοποιούνται στον τομέα των νέων τεχνολογιών (ή καλύτερα από συνέργειες επιχειρήσεων-παρόχων εφαρμογών νέας τεχνολογίας με επιχειρήσεις-πελάτες και με την ακαδημαϊκή κοινότητα), ώστε να ερευνηθούν & να αναπτυχθούν υπηρεσίες προστιθέμενης αξίας που θα βασίζονται, στην πλειονότητά τους, σε λύσεις ανάλυσης δεδομένων, Μηχανικής Μάθησης, ΤΝ (όπου μεγάλοι όγκοι δεδομένων είναι απαραίτητοι).
Για να επιτευχθεί ο παραπάνω στόχος είναι απαραίτητο η ανοικτή διάθεσή κάθε συνόλου δεδομένων να συνοδεύεται από αναφορές σε ενδεικτικά επιχειρηματικά προβλήματα που θα μπορούσαν να επιλυθούν με ανάλυση των δεδομένων αυτών καθώς καθώς και από συνοπτική παρουσίαση των δυνητικών ωφελειών. Η ανοικτή διάθεσή συνόλου δεδομένων θα μπορούσε να συνοδεύεται, επιπρόσθετα, από exploratory ανάλυση των δεδομένων (κατανομές, συσχετίσεις, συγκρίσεις, οπτικοποιήσεις, κοκ) καθώς και από αδρές περιγραφές λύσεων και των εφαρμογών που θα μπορούσαν να προκύψουν. Η επικείμενη θεσμοθέτηση των Δεδομένων Δημόσιου Σκοπού και οι πολιτικές διάθεσης των δημόσιων δεδομένων (στο πλαίσιο της διαμόρφωσης του Μοντέλου Διακυβέρνησης των Δεδομένων) θα πρέπει να λάβουν υπόψη τη σύνδεση των δεδομένων με σχετιζόμενες ανάγκες & προβλήματα και δυνητικές εφαρμογές.
Έτσι, για παράδειγμα, σύνολα δεδομένων από μετρητές παρόχων υπηρεσιών κοινής ωφέλειας ή/και φορτιστές ηλεκτροκίνησης θα μπορούσαν να χρησιμοποιηθούν για την εκτίμηση/πρόβλεψη της κατά τόπους κατανάλωσης ενέργειας, γνώση που επιτρέπει καλύτερο σχεδιασμό του δικτύου διανομής ή, ακόμη, ενσωμάτωση ευφυίας διανομής στο δίκτυο (έξυπνο δίκτυο), καλύτερο σχεδιασμό και έξυπνη λειτουργία της παραγωγής (ιδιαίτερα των ανανεώσιμων πηγών, όπου η παραγωγή παρουσιάζει μεταβλητότητα), σχεδιασμό λογισμικού για έξυπνους πλειστηριασμούς ενέργειας.
Ανοικτά είναι τα δεδομένα που στηρίζονται σε ανοικτό λογισμικό και είναι προτυποποιημένα βάσει συγκεκριμένων προδιαγραφών και τα οποία έχουν τα απαραίτητα μεταδεδομένα, που τα κάνουν αναζητήσιμα. Μέχρι σήμερα ελάχιστες τέτοιες περιπτώσεις υπάρχουν στο Ελληνικό Δημόσιο. H ανάρτηση εγγράφων μορφής pdf δεν εμπίπτει στην κατηγορία των ανοικτών δεδομένων. Η διεθνής και η Ευρωπαική πρακτική, παρέχει πρότυπα προδιαγραφών στα οποία πρέπει να στηριχθούμε, δεν χρειάζεται να «ανακαλύψουμε τον τροχό» από την αρχή.
Ένας τομέας ανοικτών δεδομένων που πρέπει να οριστεί ως προτεραιότητα και να τονιστεί στο κείμενο, είναι τα γεωχωρικά δεδομένα, τα οποία πρέπει να συγκεντρωθούν και να διατεθούν άμεσα στους ενδιαφερόμενους, χωρίς περιορισμούς και χρεώσεις, εφόσον επάνω τους, στηρίζεται η ανάπτυξη καινοτόμων εφαρμογών που θα προσθέσουν υπεραξία στην παραγωγή της ΔΔ αλλά και θα εκκινήσουν νέες επιχειρηματικές δραστηριότητες.
Στα ανοιχτά δεδομένα πρέπει να προστεθούν και τα δεδομένα για τον καιρό.
Θα πρέπει να προσφέρονται με ένα ελέυθερα διαθέσιμο API (και μάλλον συμβατό με αντίστοιχα του είδους).
Ένα άλλο ίσως παράλογο πράγμα που έχουμουμε στην Eλλάδα είναι ότι έχουμε 3 νομίζω οργανισμούς για την πρόβλεψη του καιρού. EMY, Εθνικό Αστεροσκοπείο, Εθνικό Κέντρο Θαλάσσιων Ερευνών και το forecast.uoa.gr.
Για τη νομοθεσία νομίζω έχει ξεκινήσει ένα έργο κωδικοποίησης.
Μία παγκόσμια πρωτοτυποία θα ήταν οι νόμοι να ανεβαίνουν σε ένα git repository, με τους νόμους γραμμένους σε markdown του pandoc με αποτέλεσμα να αντικατασταθούν τα ΦΕΚ σε pdf, η κωδικοποίηση να γίνεται αυτόματα, και να μπορούν να γίνονται ωραία πράγματα όπως git blame και να βλέπουμε από πότε ισχύει κάθε κομάτι της νομοθεσίας κτλ.
Στα ανοικτά δεδομένα πρέπει να ενταχθεί και:
~η ψηφιακή κωδικοποίηση της ελληνικής νομοθεσίας από απαρχές του ελληνικού κράτους.
~κωδικοποίηση ευρωπαϊκής νομοθεσίας και ποσοστό της που έχει μεταφερθεί στην ελληνική
~κωδικοποίηση συμφωνιών και διεθνών οργανισμών και σε ποιους συμμετέχει η Ελλάδα και τη ποσοστό χρησιμοποιείται η εργαλειοθήκη στην Ελλάδα.
Τα παραπάνω θα βοηθήσουν τον πολίτη να εμπιστευτεί το κράτος για τη διαφάνεια που προσφέρει και την ευκαιρία που του δίνεται να συμμετάσχει πιο ενεργά.
Είναι σημαντικό στο παρόν να διατυπώνεται ρητά ότι τα δεδομένα πρέπει να αναρτώνται σε μορφή που είναι εύκολα επεξεργάσιμη, ειδικότερα αρχεία csv, json, xml. Το παράδειγμα της διαύγειας με pdf αρχεία είναι κλασικό προς αποφυγή.
Πρέπει να υπάρχει πρόβλεψη για διαδικασία ώστε κάθε ενδιαφερόμενος να έχει πρόσβαση στα δεδομένα.
Πρέπει να ρυθμιστεί το θέμα των πνευματικών δικαιωμάτων των δεδομένων. Θα πρότεινα, το μεγαλύτερο μέρος τους να είναι ελεύθερο ακόμη και για εμπορικούς σκοπούς. Θα βοηθούσε στην ανάπτυξη καινοτομίας και καινοφυών επιχειρήσεων. Αν φτιαχτεί και κεντρικό API για την πρόσβαση σε αυτά, μπορεί να ακολουθηθεί και το μοντέλο όπου μετά από κάποιο σημείο αιτημάτων υπάρχει χρέωση για τη χρήση του.
Πρέπει να οριστούν εδώ περιοχές/τύποι δεδομένων που υποχρεωτικά θα αναρτώνται καθώς και αυστηρές ποινές σε προϊσταμένους/διοικητές υπηρεσιών που δεν θα συμμορφώνονται σε έυλογο χρονικό διάστημα (πχ αν δεν αναρτηθούν σε 2 μήνες στέρηση μισθού για κάθε μήνα καθυστέρησης). Αν το αφήσουμε για άλλο νομοσχέδιο υπάρχει ο κίνδυνος να μην υλοποιηθεί ποτέ η ανάρτηση δεδομένων.
Καλύτερη θα ήταν η συμμετοχή στο ευρωπαϊκό GAIA-X [1] το οποίο όχι μόνο κάνει όλο τον σχεδιασμό, αλλά θα κατασκευάσει και το λογισμικό για όλα αυτά που περιγράφονται. Η ΒΨΜ θα κερδίσει χρόνο, θα εξοικονομήσει πόρους και θα αποκτήσει πρόσβαση σε ανοιχτά (και μη) δεδομένα άλλων κρατών.
[1] https://www.data-infrastructure.eu/GAIAX/Navigation/EN/Home/home.html
Πρέπει τα στατιστικά στοιχεία τα οποία αναρτώνται από τους διάφορους τομείς του δημόσιου τομέα (π.χ. υγείας) να αναρτώνται σε μορφή .json (ή/και άλλες), έτσι ώστε να επιτραπεί η ελεύθερη επεξεργασία των δεδομένων σε ιδιώτες και ερευνητές.
Τα ανοικτά δεδομένα πρέπει να εδράζονται σε ανοικτές βάσεις δεδομένων στημένες επάνω σε ανοικτό λογισμικό. Η ανάπτυξη και διαχείριση τέτοιου λογισμικού και βάσεων δεδομένων πρέπει να γίνει από ειδικούς developers και κοινότητες developers στηρίζοντας τις ανοικτές κοινότητες open & free software, τις κοοπερατίες, τις κολλεκτίβες και γενικότερα τις συνεργατικές μορφές προγραμματιστών που εργάζονται με βάση τις αρχές και αξίδες της Κοινωνικής και Αλληλέγγυας Οικονομίας.
Υπάρχουν παρόμοια παραδείγματα από άλλες χώρες της Ευρώπης (για την περίπτωση της Βαριελώνης: https://meta.decidim.org/ και https://ajuntament.barcelona.cat/lesmevesajudes/) και θα πρέπει να αναπτυχθεί μια διακρατιη συνεργασία ανάπτυξης τέτοιων προγραμμάτων και βάσεων δεδομένων.
Σχόλια επί του κειμένου:
«..δεν είναι πάντοτε εύκολα προσβάσιμα και σε πολλές περιπτώσεις, η ποιότητά τους δεν επιτρέπει την αποτελεσματική τους χρήση» και, παρακάτω «Σημαντική είναι επίσης, η υλοποίηση εφαρμογής συνδυασμού, σύγκρισης και οπτικοποίησης των δεδομένων (visualization layer) που θα τα καθιστά πιο εύχρηστα.»
Δεν κατανοώ γιατί όποιος/α συνέταξε το κείμενο δεν αναφέρεται ξεκάθαρα σε ένα από τα βασικότερα προβλήματα που είδαμε με τα ανοικτά δεδομένα, δηλαδή στο searchability των δεδομένων, στο κατά πόσο μπορούν να γίνουν αναζητήσημα. Δεν αρκεί να «ανέβουν», αν είναι σε μορφή φωτογραφίας δεν μπρορεί κανείς να ψάξει με βάση λέξεις-κλειδιά. Και αυτό είδαμε ότι ενθαρρύνει μόνο τις πολύ μεγάλες εταιρείες που μπορούν να διαθέσουν τους πόρους για να ψάξουν αυτό που θέλουν.