Τεχνικός Οδηγός για τον Υπολογισμό σε Δεδομένα του Ocean

Μια επισκόπηση της έκδοσης v2, Υπολογισμός σε Δεδομένα του Ocean

Με την έκδοση v2 Υπολογισμός σε Δεδομένα, το Πρωτόκολλο Ocean παρέχει ένα μέσο για την ανταλλαγή δεδομένων με ταυτόχρονη διατήρηση της ιδιωτικότητας. Αυτός ο οδηγός εξηγεί τον Υπολογισμό σε Δεδομένα χωρίς να απαιτεί βαθιές τεχνικές γνώσεις.

Κίνητρα

Τα ιδιωτικά δεδομένα είναι δεδομένα που οι άνθρωποι ή οι οργανισμοί κρατούν για τον εαυτό τους. Μπορεί να σημαίνει οποιαδήποτε προσωπική, προσωπικά αναγνωρίσιμη, ιατρική, τρόπο ζωής, οικονομική, ευαίσθητη ή ρυθμιζόμενη πληροφορία.

Οφέλη των Ιδιωτικών Δεδομένων. Τα ιδιωτικά δεδομένα μπορούν να βοηθήσουν την έρευνα, οδηγώντας σε καινοτομίες που αλλάζουν τη ζωή στην επιστήμη και την τεχνολογία. Για παράδειγμα, περισσότερα δεδομένα βελτιώνουν την ακρίβεια πρόβλεψης των σύγχρονων μοντέλων Τεχνητής Νοημοσύνης (AI). Τα ιδιωτικά δεδομένα θεωρούνται συχνά τα πιο πολύτιμα δεδομένα, επειδή είναι τόσο δύσκολο να τα αποκτήσει κανείς, και η χρήση τους μπορεί να οδηγήσει σε δυνητικά μεγάλες απολαβές.

Κίνδυνοι των Ιδιωτικών Δεδομένων. Η κοινοποίηση ή η πώληση ιδιωτικών δεδομένων ενέχει κινδύνους. Τι γίνεται αν δεν σας προσλάβουν λόγω του ιδιωτικού ιατρικού ιστορικού σας; Τι γίνεται αν διωχθείτε για τις ιδιωτικές επιλογές του τρόπου ζωής σας; Οι μεγάλοι οργανισμοί που διαθέτουν τεράστια σύνολα δεδομένων γνωρίζουν ότι τα δεδομένα τους είναι πολύτιμα - και δυνητικά χρηματιστηριακά εκμεταλλεύσιμα - αλλά δεν επιδιώκουν την ευκαιρία για τον κίνδυνο διαφυγής δεδομένων και τη σχετική ευθύνη.

Επίλυση του Συμβιβασμού. Φαίνεται ότι υπάρχει ένα αντιστάθμισμα μεταξύ των πλεονεκτημάτων της χρήσης ιδιωτικών δεδομένων και των κινδύνων της αποκάλυψης τους. Τι θα γινόταν αν υπήρχε τρόπος να αποκομίσουμε τα οφέλη, ελαχιστοποιώντας παράλληλα τους κινδύνους; Αυτή είναι η ιδέα πίσω από τον Υπολογισμό σε Δεδομένα: αφήστε τα δεδομένα να παραμείνουν στο χώρο σας, αλλά επιτρέψτε σε τρίτους να εκτελούν συγκεκριμένες υπολογιστικές εργασίες σε αυτά για να λάβουν χρήσιμα αποτελέσματα ανάλυσης, όπως η μέση τιμή ή η δημιουργία ενός μοντέλου Τεχνητής Νοημοσύνης (AI). Τα αποτελέσματα της ανάλυσης βοηθούν σε επιστημονικά, τεχνολογικά ή επιχειρηματικά πλαίσια- ωστόσο ο υπολογισμός είναι αρκετά "συγκεντρωτικός" ή "ανώνυμος" ώστε να ελαχιστοποιείται ο κίνδυνος προστασίας της ιδιωτικής ζωής.

Μοιραστείτε ή Πουλήστε. Ο Υπολογισμός σε Δεδομένα προορίζεται να είναι χρήσιμος για την ανταλλαγή δεδομένων σε επιστημονικά ή τεχνολογικά πλαίσια. Προορίζεται επίσης να είναι χρήσιμος για την πώληση ιδιωτικών δεδομένων, διατηρώντας την ιδιωτικότητα. Αυτό μπορεί να μοιάζει με παράδοξο με την πρώτη ματιά, αλλά δεν είναι! Τα ιδιωτικά δεδομένα δεν πωλούνται άμεσα- αλλά, πωλείται συγκεκριμένη πρόσβαση σε αυτά, πρόσβαση "μόνο για τα μάτια των υπολογιστών" και όχι για τα ανθρώπινα μάτια. Έτσι, ο Υπολογισμός σε Δεδομένα στις αγορές δεδομένων είναι μια ευκαιρία για τις εταιρείες να αξιοποιήσουν τα περιουσιακά στοιχεία των δεδομένων τους.

Τι νέο υπάρχει στον Υπολογισμό σε Δεδομένα του Ocean?

Ο Υπολογισμός σε Δεδομένα του Ocean λειτουργεί στο Pacific (κύριο δίκτυο του Ocean) και στο Nile (δοκιμαστικό δίκτυο του Ocean). Ακολουθεί το τι εισάγει ο Υπολογισμός σε Δεδομένα.

Νέοι Παράγοντες

Το Πρωτόκολλο Ocean έχει αυτούς τους παράγοντες:

  • Πάροχοι Δεδομένων, οι οποίοι θέλουν να πουλήσουν τα δεδομένα τους

  • Καταναλωτές Δεδομένων, που θέλουν να αγοράσουν δεδομένα

  • Αγορές, Αποκεντρωμένες Εφαρμογές (DApps) που διευκολύνουν την ανταλλαγή δεδομένων

Ο Υπολογισμός σε Δεδομένα προσθέτει έναν νέο παράγοντα, τον Πάροχο Υπολογισμού.

  • Ο Πάροχος Υπολογισμού πωλεί υπολογισμούς σε δεδομένα, αντί για τα ίδια τα δεδομένα. Μπορεί να είναι ο ίδιος φορέας με τον πάροχο δεδομένων ή μπορεί να είναι ξεχωριστός από τον πάροχο δεδομένων και να τον εμπιστεύεται ο πάροχος δεδομένων για τον υπολογισμό των δεδομένων. Παρακάτω, αναφερόμαστε στον πάροχο δεδομένων ως πάροχο υπολογισμών.

Νέα στοιχεία

Η τεχνολογία του Ocean έχει διάφορα στοιχεία. Η Υπηρεσία Χειριστή και η Μηχανή Χειριστή είναι νέες για την v2 Υπολογισμού σε Δεδομένα.

  • Υπηρεσία Χειριστή - μια μικρο-υπηρεσία που είναι υπεύθυνη για τη διαχείριση της ροής εργασιών και την εκτέλεση των αιτημάτων. Επικοινωνεί άμεσα και λαμβάνει εντολές από το Brizo (διακομιστής μεσολάβησης του παρόχου δεδομένων) και εκτελεί υπολογισμούς σε δεδομένα, που παρέχονται από το Brizo.

  • Μηχανή Χειριστή - μια backend υπηρεσία που είναι υπεύθυνη για την ενορχήστρωση της υπολογιστικής υποδομής χρησιμοποιώντας το Kubernetes ως backend. Συνήθως, η Μηχανή Χειριστή ανακτά τις ροές εργασίας που έχουν δημιουργηθεί από την Υπηρεσία Χειριστή στο Kubernetes. Διαχειρίζεται επίσης την υποδομή που είναι απαραίτητη για την ολοκλήρωση της εκτέλεσης των ροών εργασίας υπολογισμού.

Νέος τύπος περιουσιακού στοιχείου

Πριν, τα σύνολα δεδομένων ήταν ο μόνος τύπος περιουσιακού στοιχείου στα μεταδεδομένα (DDO). Ο Υπολογισμός σε Δεδομένα εισάγει έναν νέο τύπο περιουσιακού στοιχείου - τον αλγόριθμο, ο οποίος είναι ένα σενάριο που μπορεί να εκτελεστεί σε σύνολα δεδομένων.

Πώς λειτουργεί ο Υπολογισμός σε Δεδομένα;

Ας δούμε πώς λειτουργεί ο Υπολογισμός σε Δεδομένα με ένα παράδειγμα.

Ας υποθέσουμε ότι η Arena είναι ένας σημαντικός παίκτης στην αυτοκινητοβιομηχανία. Η Arena θέλει να δημιουργήσει Αυτόνομα Οχήματα (AV) και χρειάζεται έναν τόνο δεδομένων για να εκπαιδεύσει τα μοντέλα Τεχνητής Νοημοσύνης (AI) των AV της να λειτουργούν αποτελεσματικά. Δυστυχώς, η Arena δεν έχει αρκετά δεδομένα για να το κάνει αυτό. Σχεδιάζουν να αγοράσουν δεδομένα από τον μεγάλο προμηθευτή αυτοκινήτων Axios.

Η Axios δεν ενδιαφέρεται να πουλήσει δεδομένα στην Arena λόγω των ζητημάτων απορρήτου των πελατών της. Η Arena προτείνει τη χρήση Υπολογισμού σε Δεδομένα του Ocean, ώστε η Arena να μπορεί να κατασκευάσει μοντέλα Τεχνητής Νοημοσύνης (AI) στα δεδομένα της Axios, χωρίς τα δεδομένα να εγκαταλείπουν ποτέ τους διακομιστές της Axios. Η Axios συμφωνεί, καθώς αυτό της επιτρέπει να αξιοποιήσει τα δεδομένα της, διατηρώντας παράλληλα την ιδιωτικότητα.

  1. Η Axios χρησιμοποιεί τον Υπολογισμό σε Δεδομένα του Ocean για τη δημιουργία της υπολογιστικής υποδομής της (συμπεριλαμβανομένων των Brizo,Υπηρεσία Χειριστή και Μηχανή Χειριστή). Στη συνέχεια, η Axios δημοσιεύει τα περιουσιακά στοιχεία δεδομένων της στο Ocean και λαμβάνει ένα αποκεντρωμένο αναγνωριστικό (DID) για το δημοσιευμένο περιουσιακό στοιχείο δεδομένων.

2. Η Arena ανακαλύπτει τα δημοσιευμένα δεδομένα σε μια αγορά δεδομένων του Ocean χρησιμοποιώντας αναζήτηση, φιλτράρισμα ή περιήγηση.

3. Η Arena πιστεύει ότι τα δεδομένα θα μπορούσαν να αποδειχθούν χρήσιμα για την ανάπτυξη των AV, με βάση την περιγραφή. Αγοράζουν πρόσβαση για να εκπαιδεύσουν το μοντέλο Τεχνητής Νοημοσύνης (AI) τους σε αυτά τα δεδομένα μέσω της υπηρεσίας υπολογισμού.

4. Ως συνήθως, το Brizo (ο ψηφιακός πληρεξούσιος για τον πάροχο δεδομένων/υπολογισμών) εκτελεί τις απαραίτητες επικυρώσεις σε όρους όπως η άδεια κατανάλωσης, η υπογραφή συμφωνίας παροχής υπηρεσιών και η επιβεβαίωση της πληρωμής.

5. Σε περίπτωση αποτυχίας επικύρωσης, το Brizo ζητά από την Arena να εκτελέσει μερικά απαραίτητα βήματα

Το Brizo επιβάλλει υποχρεωτικές ενέργειες που απαιτούνται από τον καταναλωτή, οι οποίες καθορίζονται από τον πάροχο.

6. Η Arena δημοσιεύει τον αλγόριθμο της στο Ocean και λαμβάνει ένα αποκεντρωμένο αναγνωριστικό (DID) (π.χ. algoDID) για τον αλγόριθμο.

ΣΗΜΕΙΩΣΗ - Ο Υπολογισμός σε Δεδομένα είναι γλωσσικά ανεξάρτητος και υποστηρίζει όλους τους τύπους υπολογιστικών πλατφορμών, περιβαλλόντων και γλωσσών προγραμματισμού. Οι πάροχοι υπολογιστικών υπηρεσιών πρέπει να παρέχουν τις κατάλληλες λεπτομέρειες σχετικά με τον τύπο της υπολογιστικής υπηρεσίας (πλατφόρμα, περιβάλλον, CPU, RAM κ.λ.π.) που προσφέρουν. Αργότερα, οι καταναλωτές μπορούν να περιηγηθούν στα διάφορα περιβάλλοντα των παρόχων υπολογιστικών υπηρεσιών που υποστηρίζουν τους αλγορίθμους τους και να επιλέξουν ένα ανάλογα.

Ο καταναλωτής δημοσιεύει τον Αλγόριθμο που θα χρησιμοποιηθεί για τον υπολογισμό των δεδομένων του παρόχου

7. Η Arena υπογράφει μια συμφωνία παροχής υπηρεσιών και καταβάλλει 50 OCEAN στο συμβόλαιο μεσεγγύησης (μέρος των Συμβολαίων Keeper) ως πληρωμή για την υπηρεσία υπολογισμού.

Ο καταναλωτής υπογράφει Συμφωνία Παροχής Υπηρεσιών και πληρώνει για την πρόσβαση στην υπολογιστική υπηρεσία

8. Τώρα που η Arena έχει εκτελέσει όλα τα υποχρεωτικά βήματα που απαιτούνται από την Axios, η Arena στέλνει ένα αίτημα υπολογισμού πίσω στο Brizo.

ΣΗΜΕΙΩΣΗ - Ο καταναλωτής δεν χρειάζεται να στείλει αίτηση υπολογισμού αμέσως μετά την αγορά πρόσβασης στην υπηρεσία υπολογισμού. Μπορεί να στείλει αίτημα υπολογισμού αργότερα, έως ότου λήξει η πρόσβαση στην υπηρεσία υπολογισμού.

9. Το Brizo επαληθεύει ότι η πληρωμή και όλες οι άλλες υποχρεωτικές ενέργειες έχουν πραγματοποιηθεί από την Arena.

10. Αφού επικυρωθούν και ολοκληρωθούν όλες οι ενέργειες, το Brizo λαμβάνει τα σύνολα δεδομένων και τον αλγόριθμο (χρησιμοποιώντας τα dataDID και algorithmDID, αντίστοιχα) και δίνει εντολή στην Υπηρεσία Χειριστή να ξεκινήσει τον υπολογισμό χρησιμοποιώντας τον δεδομένο αλγόριθμο στα δεδομένα.

ΣΗΜΕΙΩΣΗ - Δεδομένου ότι όλη αυτή η διαδικασία λαμβάνει χώρα στην πλευρά του παρόχου δεδομένων (ή αλλιώς παρόχου υπολογισμού), τα δεδομένα παραμένουν ιδιωτικά και δεν αποκαλύπτονται στον καταναλωτή.

11. Η Υπηρεσία Χειριστή πραγματοποιεί ελέγχους σε όλες τις εισόδους και, όταν είναι έτοιμη, δίνει εντολή στη Μηχανή Χειριστή να ξεκινήσει τη διαδικασία υπολογισμού εντός των δεδομένων και του αλγορίθμου που έχουν δοθεί.

ΣΗΜΕΙΩΣΗ - Η Υπηρεσία Χειριστή και η Μηχανή Χειριστή χρησιμοποιούν το σύμπλεγμα Kubernetes για την εκτέλεση των υπολογισμών. Ένας καταναλωτής μπορεί να εκτελέσει μόνο μία ενεργή εργασία ανά υπολογιστική υπηρεσία. Οι καταναλωτές μπορούν να επιλέξουν να επανεκκινήσουν την ίδια εργασία ή να ξεκινήσουν μια νέα εργασία μόλις μια ενεργή εργασία ολοκληρωθεί ή σταματήσει χειροκίνητα.

Μετά τις απαραίτητες επικυρώσεις, η Υπηρεσία Χειριστή δίνει εντολή στη Μηχανή Χειριστή να ξεκινήσει τον υπολογισμό.

12. Μόλις ο υπολογισμός εκτελεστεί με επιτυχία, η Μηχανή Χειριστή δημοσιεύει τα αποτελέσματα σε ένα bucket του AWS S3. Τα αποτελέσματα αποτελούνται από το μοντέλο εκροής και τα αρχεία καταγραφής εκτέλεσης.

ΣΗΜΕΙΩΣΗ - Όταν εκτελείται με επιτυχία, η υπηρεσία υπολογισμού παράγει δύο τύπους αποτελεσμάτων: (1) εκροή και (2) αρχεία καταγραφής εκτέλεσης. Οι καταναλωτές μπορούν να επιλέξουν ένα από τα δύο ή και τα δύο να τους παραδοθούν μετά την ολοκλήρωση. Αυτά τα αποτελέσματα δημοσιεύονται στον αποθηκευτικό χώρο AWS S3 κατά την ολοκλήρωση και μια διεύθυνση URL AWS S3 κοινοποιείται στον καταναλωτή. Ο καταναλωτής μπορεί να επιλέξει να κατεβάσει ή να μετακινήσει τα εν λόγω αποτελέσματα στον δικό του χώρο αποθήκευσης S3.

Η Μηχανή Χειριστή δημοσιεύει τα αποτελέσματα στο bucket S3 μετά την ολοκλήρωση του υπολογισμού

13. Η Arena μπορεί να ενημερωθεί για την κατάσταση ολοκλήρωσης του υπολογισμού ανά πάσα στιγμή. Κατά την ερώτηση, το Brizo λαμβάνει την τρέχουσα κατάσταση της εργασίας υπολογισμού από τη Μηχανή Χειριστή μέσω της Υπηρεσίας Χειριστή. Μόλις η εργασία ολοκληρωθεί επιτυχώς, το Brizo, εκ μέρους της Axios, μοιράζεται τα αποτελέσματα (μοντέλο εκροής και αρχεία καταγραφής) URL με την Arena.

Ο καταναλωτής ενημερώνεται μετά από ερώτηση σχετικά με την κατάσταση ολοκλήρωσης της εργασίας υπολογισμού

14. Σε αυτό το σημείο, η Arena μπορεί να αποφασίσει αν είναι ικανοποιημένη με τα αποτελέσματα. Εάν δεν είναι ικανοποιημένοι, μπορούν να επιλέξουν να επανεκκινήσουν την εκτέλεση του υπολογισμού με τον ίδιο ή διαφορετικό αλγόριθμο, μέχρι να λήξει η πρόσβαση στον υπολογισμό.

Ακολουθεί η πλήρης αρχιτεκτονική του Υπολογισμού σε Δεδομένα του Ocean.

Συμπέρασμα

Σε αυτό το άρθρο περιγράφεται ο τρόπος με τον οποίο ο Υπολογισμός σε Δεδομένα επιτρέπει στους παρόχους δεδομένων να μοιράζονται ή να πωλούν τα πολύτιμα προσωπικά τους δεδομένα διατηρώντας την ιδιωτικότητα.

Τα ακόλουθα αποθετήρια Github παρέχουν πιο λεπτομερείς τεχνικές πληροφορίες.

Μόλις είστε έτοιμοι να ξεκινήσετε, μπείτε στα παρακάτω σεμινάρια και δοκιμάστε τον Υπολογισμό σε Δεδομένα για τον εαυτό σας!


Αν είστε νέος στο Πρωτόκολλο Ocean, ίσως βρείτε χρήσιμο τον οδηγό εισαγωγής μας. Είναι ο απόλυτος οδηγός για την αρχιτεκτονική και την τεχνολογική στοίβα του Ocean για τους νεοεισερχόμενους.


Ακολουθήστε το Ocean Protocol στο Twitter, το Telegram, το LinkedIn, το GitHub και το Newsletter για ενημερώσεις και ανακοινώσεις σχετικά με το έργο. Και συνομιλήστε απευθείας με άλλους προγραμματιστές στο Gitter.

Ευχαριστώ τους Samer Sallam, Alex Coseru και Matthias Kretschmann.


Πρωτότυπο Άρθρο (Αγγλική): Technical Guide to Ocean Compute-to-Data

Συντάκτης Πρωτότυπου Άρθρου: Manan Patel

Ημερομηνία Συγγραφής Πρωτότυπου Άρθρου: 19 Μαΐου 2020