Μέχρι σήμερα, οι εταιρείες που δραστηριοποιούνται στον χώρο του σχεδιασμού των πρωτεϊνών έχουν επικεντρωθεί σε μεγάλο βαθμό στην ανακατασκευή υπαρχουσων πρωτεϊνών για την εκτέλεση νέων εργασιών ή τη βελτίωση συγκεκριμένων ιδιοτήτων, αντί για πραγματικό σχεδιασμό από την αρχή. Για παράδειγμα, οι επιστήμονες έχουν βασιστεί στην υπάρχουσα γνώση σχετικά με την πρωτεΐνη ακίδας SARS-CoV-2 και τις αλληλεπιδράσεις της με την πρωτεΐνη υποδοχέα ACE2 για να σχεδιάσουν μια συνθετική πρωτεΐνη που μπορεί να εμποδίσει σταθερά την είσοδο του ιού σε διάφορες παραλλαγές. Κάποια υπολογιστικά μοντέλα μπορούν να δημιουργήσουν εντελώς νέες πρωτεΐνες, που δεν έχουν ξαναβρεθεί στη φύση. Αυτά τα εργαλεία μοντελοποίησης ανήκουν στην ίδια κατηγορία αλγορίθμων που χρησιμοποιούνται για την παραγωγή συναρπαστικών έργων τέχνης που δημιουργούνται από προγράμματα τεχνητής νοημοσύνης. Σε αυτές τις περιπτώσεις, το λογισμικό εκπαιδεύεται σε τεράστιες ποσότητες σχολιασμένων δεδομένων εικόνας και στη συνέχεια χρησιμοποιεί αυτές τις πληροφορίες για να δημιουργήσει νέες εικόνες ως απάντηση σε ερωτήματα των χρηστών. Το ίδιο κατόρθωμα μπορεί να επιτευχθεί με τις πρωτεϊνικές αλληλουχίες και δομές, όπου ο αλγόριθμος βασίζεται σε μια πλούσια αποθήκη βιολογικών πληροφοριών του πραγματικού κόσμου για να ονειρευτεί νέες πρωτεΐνες με βάση τα πρότυπα και τις αρχές που παρατηρούνται στη φύση, για να γίνει αυτό, οι ερευνητές πρέπει να καθοδηγήσουν τον υπολογιστή σχετικά με τους βιοχημικούς και φυσικούς περιορισμούς που επηρεάζουν τον σχεδιασμό της πρωτεΐνης.
Μια αποτελεσματική στρατηγική για την κατανόηση της αλληλουχίας και της δομής των πρωτεϊνών είναι η προσέγγισή τους ως «κείμενο», χρησιμοποιώντας αλγόριθμους μοντελοποίησης γλώσσας που ακολουθούν κανόνες βιολογικής «γραμματικής» και «σύνταξης». Για να δημιουργήσει μια ευχάριστη πρόταση ή ένα έγγραφο, ο αλγόριθμος πρέπει να μάθει για τις σχέσεις μεταξύ διαφορετικών τύπων λέξεων, αλλά πρέπει επίσης να μάθει γεγονότα για τον κόσμο για να δημιουργήσει ένα έγγραφο που να είναι συνεκτικό και λογικό.
Ήδη υπάρχει ένας αλγόριθμος μοντελοποίησης γλώσσας που μπορεί να δώσει νέες πρωτεΐνες σχεδιασμένες από υπολογιστή που μπορούν να παραχθούν επιτυχώς στο εργαστήριο με καταλυτικές δραστηριότητες συγκρίσιμες με εκείνες των φυσικών ενζύμων. Εκτός από τη δύναμη των νέων αλγορίθμων, ο τεράστιος όγκος δομικών δεδομένων που συλλαμβάνεται από τους βιολόγους επέτρεψε στο πεδίο σχεδιασμού πρωτεϊνών να απογειωθεί.
Οι ερευνητές έχουν ήδη καταφέρει να δημιουργήσουν πρωτεΐνες με νέες λειτουργίες για χρήση στη γεωργία, καθώς και στην επιστήμη των υλικών και των τροφίμων. Αυτά τα έργα συχνά ξεκινούν με μια σχετικά καλά εδραιωμένη βασική αντίδραση που καταλύεται στη φύση. Μερικά από τα έργα περιλαμβάνουν ένα φυτικό ένζυμο που μπορεί να διασπάσει ένα ευρέως χρησιμοποιούμενο ζιζανιοκτόνο, καθώς και ένζυμα που μπορούν να μετατρέψουν σχετικά χαμηλής αξίας φυτικά υποπροϊόντα σε χρήσιμα φυσικά γλυκαντικά. Ωστόσο, μια πρωτεΐνη με εξαιρετικές καταλυτικές ιδιότητες μπορεί να είναι εξαιρετικά δύσκολο να κατασκευαστεί τεχνητά ή να παρουσιάζει φτωχές ιδιότητες ως φάρμακο. Στο μέλλον, πάντως, οι αλγόριθμοι επόμενης γενιάς θα καθιστούν δυνατή τη δημιουργία πρωτεϊνών που θα είναι βελτιστοποιημένες για πολλαπλή χρήση.