Στην εποχή της ψηφιακής δημιουργίας, η Τεχνητή Νοημοσύνη (AI) μας δίνει εργαλεία που πριν λίγα χρόνια φάνταζαν επιστημονική φαντασία. Ένα από τα πιο ισχυρά εργαλεία είναι το Stable Diffusion, το οποίο μας επιτρέπει όχι μόνο να δημιουργούμε εικόνες από το μηδέν, αλλά και να “εκπαιδεύουμε” τον υπολογιστή να αναγνωρίζει δικά μας πρόσωπα ή αντικείμενα (μέσω της τεχνικής LoRA).
Σε αυτό το άρθρο, θα δούμε βήμα-προς-βήμα πώς μπορείτε να εγκαταστήσετε αυτά τα εργαλεία στον υπολογιστή σας και να δημιουργήσετε τις δικές σας μοναδικές συνθέσεις.
Μέρος 1: Τι θα χρειαστούμε (Απαιτήσεις Συστήματος)
Η διαδικασία αυτή γίνεται τοπικά (local) στον υπολογιστή μας, κάτι που μας προσφέρει ιδιωτικότητα και μηδενικό κόστος, αλλά απαιτεί ισχυρό υλικό.
- Λειτουργικό: Windows 10 ή 11.
- Κάρτα Γραφικών (GPU): Απαραίτητα NVIDIA (σειρά RTX 3060 ή καλύτερη προτείνεται).
- Μνήμη VRAM: Τουλάχιστον 8GB (για εκπαίδευση μοντέλων) ή 4GB (μόνο για δημιουργία εικόνων).
- Χώρος στο Δίσκο: Τουλάχιστον 50GB ελεύθερα (τα μοντέλα είναι μεγάλα αρχεία).
Μέρος 2: Η Εγκατάσταση (Εύκολος Τρόπος)
Θα χρησιμοποιήσουμε το Stability Matrix, ένα λογισμικό διαχείρισης που αυτοματοποιεί την εγκατάσταση όλων των απαραίτητων εργαλείων.
Βήμα 1: Λήψη Λογισμικού
- Επισκεφθείτε τη σελίδα του Stability Matrix στο GitHub.
- Στην ενότητα “Assets”, κατεβάστε το αρχείο StabilityMatrix-win-x64.zip.
- Αποσυμπιέστε το φάκελο και τρέξτε το αρχείο StabilityMatrix.exe.
Βήμα 2: Πρόληψη Σφαλμάτων Δικτύου
Πριν προχωρήσετε, για να αποφύγετε κολλήματα κατά τη λήψη των πακέτων:
- Ανοίξτε μια γραμμή εντολών (πατήστε Windows key, γράψτε cmd, Enter).
- Πληκτρολογήστε την εντολή: git config –global –unset credential.helper
- Πατήστε Enter.
Βήμα 3: Εγκατάσταση Πακέτων
Μέσα από το Stability Matrix (καρτέλα Packages), πατήστε + Add Package και εγκαταστήστε:
- Stable Diffusion WebUI (Automatic1111): Το περιβάλλον για τη δημιουργία εικόνων.
- Kohya_ss: Το εργαλείο για την εκπαίδευση των δικών σας μοντέλων.
⚠️ Αντιμετώπιση Κρίσιμου Σφάλματος (Error 128 / Repo Not Found)
ΣΗΜΕΙΩΣΗ: Πρόκειται για προσωρινή λύση μέχρι να βγει επίσημο update.
Αν κατά την εγκατάσταση δείτε σφάλμα ότι δεν μπορεί να κατεβάσει το stablediffusion (Error 404 ή 128), αυτό συμβαίνει επειδή η επίσημη σελίδα στο GitHub διαγράφηκε.
Η Λύση: Πρέπει να αλλάξουμε χειροκίνητα τη διεύθυνση σε ένα αρχείο Python.
- Πηγαίνετε στον φάκελο εγκατάστασης: …\Data\Packages\Stable Diffusion WebUI\modules\
- Βρείτε το αρχείο launch_utils.py.
- Κάντε δεξί κλικ -> Άνοιγμα με Σημειωματάριο (Notepad).
- Πατήστε Ctrl+F και ψάξτε για: STABLE_DIFFUSION_REPO.
- Θα βρείτε δύο γραμμές που μοιάζουν με αυτές:
- stable_diffusion_repo = os.environ.get(‘STABLE_DIFFUSION_REPO’, “[https://github.com/Stability-AI/stablediffusion.git](https://github.com/Stability-AI/stablediffusion.git)”)
- stable_diffusion_commit_hash = os.environ.get(‘STABLE_DIFFUSION_COMMIT_HASH’, “cf1d67a6fd5ea1aa600c4df58e5b47da45f6bdbf”)
- Αντικαταστήστε τις με τις παρακάτω (που δείχνουν σε ενεργό αντίγραφο):
- stable_diffusion_repo = os.environ.get(‘STABLE_DIFFUSION_REPO’, “[https://github.com/Kantyadoram/stable-diffusion-stability-ai.git](https://github.com/Kantyadoram/stable-diffusion-stability-ai.git)”)
- stable_diffusion_commit_hash = os.environ.get(‘STABLE_DIFFUSION_COMMIT_HASH’, “7435a5be1050962a936a4ef624b43814ee8824a8”)
- ΠΡΟΣΟΧΗ ΣΤΗ ΣΤΟΙΧΙΣΗ (Indentation): Βεβαιωθείτε ότι οι νέες γραμμές έχουν ακριβώς τα ίδια κενά στην αρχή με τις υπόλοιπες εντολές, αλλιώς το πρόγραμμα θα βγάλει σφάλμα (IndentationError). Πρέπει να είναι απόλυτα στοιχισμένες κάθετα.
- Αποθηκεύστε το αρχείο και ξανατρέξτε την εγκατάσταση.
Πηγή λύσης: GitHub Issues – Automatic1111
Μέρος 3: Προετοιμασία Δεδομένων (Dataset)
Για να μάθει το AI ένα νέο πρόσωπο (π.χ. έναν φανταστικό χαρακτήρα, τον “Captain X”), πρέπει να του δείξουμε παραδείγματα.
- Συλλογή: Συγκεντρώστε 15-20 καθαρές φωτογραφίες του θέματος.
- Επεξεργασία: Χρησιμοποιήστε το εργαλείο Birme.net για να κόψετε (crop) όλες τις εικόνες σε διάσταση 512x512 pixels.
- Οργάνωση Φακέλων (Κρίσιμο Βήμα):
- Δημιουργήστε έναν φάκελο στην Επιφάνεια Εργασίας με όνομα Training_Data.
- Μέσα σε αυτόν, φτιάξτε έναν υποφάκελο με συγκεκριμένη μορφή ονόματος: 20_captainX.
- Το 20 δηλώνει πόσες φορές θα “μελετήσει” το AI κάθε εικόνα.
- Το captainX είναι η λέξη-κλειδί (trigger word) που θα χρησιμοποιείτε.
- Τοποθετήστε τις φωτογραφίες ΜΕΣΑ στον φάκελο 20_captainX.
Μέρος 4: Η Εκπαίδευση του Μοντέλου (LoRA vs Dreambooth)
ΠΡΟΣΟΧΗ: Στο Kohya υπάρχουν δύο καρτέλες. Εμείς θέλουμε την καρτέλα LoRA (που φτιάχνει μικρά, ευέλικτα αρχεία ~100MB) και ΟΧΙ την Dreambooth (που φτιάχνει τεράστια μοντέλα 2GB).
Ανοίγουμε το Kohya_ss και ακολουθούμε τη διαδικασία:
1. Περιγραφή Εικόνων (Captioning)
Το AI πρέπει να ξέρει τι βλέπει.
- Πηγαίνουμε στο μενού Utilities > Captioning > BLIP Captioning.
- Στο πεδίο Image folder to caption, επιλέγουμε τον φάκελο με τις εικόνες (20_captainX).
- ΤΟ ΜΥΣΤΙΚΟ ΚΟΛΠΟ (Prefix): Στο πεδίο Prefix to add to BLIP caption (ή απλά Prefix), γράψτε τη λέξη κλειδί σας ακολουθούμενη από κόμμα και κενό (π.χ. captainX, ).
- Αυτό θα προσθέσει αυτόματα το όνομα σε ΟΛΑ τα αρχεία, γλιτώνοντάς σας από το χειροκίνητο γράψιμο!
- Πατάμε Caption Images.
2. Ρυθμίσεις Εκπαίδευσης (Καρτέλα LoRA)
Πηγαίνουμε στην καρτέλα LoRA -> Training:
- Source Model: Επιλέγουμε runwayml/stable-diffusion-v1-5 (ή ένα custom model όπως το Realistic Vision).
- Folders:
- Image folder: Επιλέγουμε τον ΓΟΝΙΚΟ φάκελο (Training_Data) και όχι τον υποφάκελο.
- Output name: Δίνουμε όνομα στο αρχείο μας (π.χ. captainX).
- Parameters (Για ταχύτητα):
- Train batch size: 1
- Epoch: 10
- Resolution: 512,512 (Αν βάλετε 768 θα αργήσει πολύ).
- Gradient Checkpointing: Ενεργοποιημένο (Τικ).
- Mixed/Save Precision: fp16.
- Πατάμε Start Training.
Σε περίπου 10-15 λεπτά, θα έχουμε το αρχείο .safetensors στον φάκελο output.
Μέρος 5: Η Δημιουργία Εικόνων
Τώρα μεταβαίνουμε στο Stable Diffusion WebUI.
1. Εγκατάσταση
- Μεταφέρουμε το αρχείο .safetensors που φτιάξαμε στον φάκελο: …\Stable Diffusion WebUI\models\Lora.
- Προτείνεται να κατεβάσουμε ένα ρεαλιστικό μοντέλο (π.χ. Realistic Vision) και να το βάλουμε στον φάκελο models\Stable-diffusion.
2. Δημιουργία (Prompting)
Στο WebUI, επιλέγουμε το μοντέλο μας και γράφουμε:
- Positive Prompt: Τι θέλουμε να δούμε. Πρέπει να περιέχει τη λέξη κλειδί και την εντολή LoRA.
- Παράδειγμα: photo of captainX, wearing spacesuit, on mars, intricate details, <lora:captainX:1.0>
- Negative Prompt: Τι θέλουμε να αποφύγουμε (π.χ. cartoon, ugly, deformed).
3. Η Τεχνική Inpainting (Για δύσκολες σκηνές)
Αν το πρόσωπο δεν αποδίδεται σωστά σε πολύπλοκες σκηνές, χρησιμοποιούμε την τεχνική “Σώμα Πρώτα, Πρόσωπο Μετά”:
- Δημιουργούμε τη σκηνή χωρίς το LoRA (με έναν τυχαίο χαρακτήρα).
- Στέλνουμε την καλή εικόνα στο Inpaint.
- Ζωγραφίζουμε μια μάσκα μόνο στο πρόσωπο.
- Γράφουμε νέο Prompt μόνο για το πρόσωπο, ενεργοποιώντας τώρα το LoRA, και ξαναδημιουργούμε την περιοχή.
Συμπέρασμα
Η διαδικασία της εκπαίδευσης AI μοντέλων ανοίγει νέους ορίζοντες ψηφιακής δημιουργίας. Με υπομονή και πειραματισμό, μπορείτε να μετατρέψετε τον υπολογιστή σας σε ένα εργαστήριο τέχνης χωρίς περιορισμούς.
Καλές δημιουργίες!
