Sitemap autodiscovery

Οι εταιρίες Yahoo, Ask, MSN και Google ένωσαν τις δυνάμεις τους για να κάνουν τα sitemaps autodiscoverable κάνοντας χρήση του αρχείου robots.txt. Εφόσον δηλώσουμε στις μηχανές αναζήτησης την τοποθεσία του sitemap (στο αρχείο robots.txt) θα μπορέσουν να το βρουν και να το χρησιμοποιήσουν.

Απλώς προσθέστε την παρακάτω γραμμή στο αρχείο robots.txt: Sitemap: <τοποθεσία_του_sitemap>
Η <τοποθεσία_του_sitemap> πρέπει να είναι το πλήρες URL στο Sitemap, για παράδειγμα: http://www.klaus.gr/sitemap.xml
Η οδηγία Sitemap: ... μπορεί να τοποθετηθεί σε οπουδήποτε μέρος στο αρχείο robots.txt

Περισσότερες πληροφορίες: sitemaps.org

Σχόλια (0) 13.04.2007. 01:48

mod_security bypass

Ενα πάρα πολύ καλό εργαλείο για τον apache είναι το mod_security το οποίο μπορεί να φιλτράρει τα requests που γίνονται στον Apache και αναλόγως να επιτρέπει ή όχι ένα request.

Δυστυχώς όμως το πρόγραμμα δεν κάνει διακρίσεις... έτσι αν γράφω ένα άρθρο που περιέχει την μαγική λέξη /etc/passwd τότε παίρνει εμπρός το mod_secure και δεν επιτρέπει το POST/GET request.

Η λύση που βρήκα είναι τουλάχιστον για τα άρθρα που γράφω όπου περιέχουν την παραπάνω λέξη να τοποθετώ τον unicode χαρακτήρα &#47; στην θέση του /
Έτσι γράφω &#47;etc/passwd και έχω σαν αποτέλεσμα /etc/passwd

Οπτικά έχουμε το ίδιο χαρακτήρα και το mod_security δεν παραπονιέται! Γενικά όλοι οι χαρακτήρες μπορούν να γραφτούν με τον παραπάνω τρόπο.

Περισσότερες πληροφορίες:List of XML and HTML character entity references

Σχόλια (1) 10.04.2007. 23:33

Greek ISO-8859-7 charset_table για το Shpinx

Το shpinx είναι μια fulltext μηχανή αναζήτησης με κύριο πλεονέκτημα την ταχύτητα αναζήτησης και δημιουργίας indexes. Δουλεύει με MyIsam kai InnoDB πίνακες οπότε είναι ιδανικό για χρήση με MySql. Επίσης είναι open-source.

O λόγος που ήρθα σε επαφή με το shpinx είναι η "αποτυχία" της MySql στα fulltext indexes. Επειδή ήθελα να κάνω fulltext search πχ σε 3 πεδία έπρεπε να κάνω index για όλους τους συνδιασμούς!! (π.χ. [name,surname,desc],[name,surname],[name,desc],[name],[surname],[desc]). Αν όμως θέλουμε να κάνουμε index 5 πεδία τότε θα έπρεπε να φτιάξω 120 διαφορετικά indexes!!! (5!= 120) οπότε το fulltext της MySql είναι αποτυχημένο για αυτόν και μόνο τον λόγο.

Για να λειτουργήσει το shpinx χρειάζεται να του ορίσουμε και ποιους χαρακτήρες θα κάνει index. charset_table = 0..9, A..Z->a..z, _, a..z, -, U+2F, U+23, U+2A, U+2E, U+B6->U+E1, U+DC->U+E1, U+B8->U+E5, U+DD->U+E5, U+B9->U+E7, U+DE->U+E7, U+BA->U+E9, U+C0->U+E9, U+DA->U+E9, U+DF->U+E9, U+FA->U+E9, U+BC->U+EF, U+FC->U+EF, U+BE->U+F5, U+DB->U+F5, U+E0->U+F5, U+FB->U+F5, U+FD->U+F5, U+BF->U+F9, U+FE->U+F9, U+F2->U+F3, U+C1..U+D1->U+E1..U+F1, U+D3..U+D9->U+F3..U+F9, U+E1..U+F1, U+F3..U+F9

Περισσότερες πληροφορίες σχετικά με το Shinx θα βρείτε εδώ:Sphinx Search.
Τον πίνακα χαρακτήρων του ISO-8859-7 θα το βρείτε εδώ:ISO-8859-7 MAP

Σχόλια (0) 09.04.2007. 17:34