Archiv 11.2.2005 - 16.2.2005

sohu-search ist ein seltsamer Bot

Bei mir sammelt gerade der Suchmaschinenbot von sohu.com die Seiten ab. Soweit, so gut. Er benutzt die robots.txt, was schon mal gut ist. Aber was mich wirklich stutzen lässt, sind zwei Sachen:

Erstens greift er auf jede Seite zweimal zu. Einmal eine HEAD Zugriff und ein GET Zugriff. Das ist ziemlich dämlich aus mehreren Gründen. Zum Einen kann man es mittels Conditional GET ganz einfach direkt erledigen und zum Anderen provoziert das bei dynamisch generierten Seiten doppelte Seitengenerierung - denn auch wenn der HEAD Request nur die Headerzeilen holt, um z.B. die Content-length zu berechnen muss die seite trotzdem erstellt werden (hängt natürlich davon ab wie das generierende System geschrieben ist).

Zweitens greift er alle paar Seiten auf eine Seite namens abcdefghijklmn.htm zu. Und was der Quatsch soll, verstehe ich wirklich nicht. Irgendein Keep-Alive-Check? Keine Ahnung. Sehr strange.

Studie: Vioxx verdoppelte das Herzinfarkt-Risiko - ich sagte ja schon, ich hab das mal ein halbes Jahr lang gekriegt, das Medikament. Ganz toll.

Workaround for IDN Spoofing Issue - mittels AdBlock Erweiterung einfach alle URIs sperren die Namensbestandteile haben die nicht in 7bit-ASCII liegen.

APOD: 2005 January 21 - Metal on the Plains of Mars. Cooles Bild - Opportunity findet Teile seines eigenen Hitzeschildes wieder. Und noch einen kleinen Meteoriten gleich dazu. Vielleicht findet er ja auch noch Beagle irgendwann

Bill Gates versucht Dänemark zu erpressen

Bill Gates versucht Dänemark mit Navision zu erpressen. Nachdem Microsoft Navision gekauft hat werden die 800 Arbeitsplätze jetzt als Druckmittel gegen die dänische Regierung eingesetzt um diese bezüglich der Softwarepatentrichtlinie in Europa an die Wünsche Microsofts zu binden.

Wenn man sich anschaut welche Unternehmen für die Softwarepatentrichtlinie sind und welche Methoden angewendet werden (Erpressung, Bestechung, Lobbyismus, FUD) um sie durchzudrücken wird einem echt übel. Das sind schon fast Mafia-Methoden. Und vermutlich ist die Motivation hinter der ganzen Sache genauso ehrlich wie die Mafia.

Es gibt schon das erste Microsoft Dementi - es muss also was dran sein an der Erpressungsstory. In dem Artikel über das Dementi sind auch Angaben über andere Firmen die Polen unter Druck gesetzt haben. Und scheinbar hat es bei Polen - zumindestens zum Teil - gewirkt.

Schon wirklich widerlich welches Gebahren die Firmen an den Tag legen - Siemens erpresst den deutschen Arbeitsmarkt mit der Drohung die Handysparte z.B. nach Polen zu verlegen und erpresst mit den gleichen Arbeitsplätzen die polnische Regierung bei den Softwarepatenten. Die ganze Moppelkotze funktioniert nur weil die Politiker nicht in der Lage sind miteinaner zu sprechen und tatsächlich mal gemeinsame europäische Ziele zu verfolgen - und damit diesen Spielchen der Branchenriesen einen Riegel vorzuschieben. Weil jeder Politiker nur sein eigenes Scherflein ins Trockene bringen will und maximal auf seine eigenen Vorteile im eigenen Land guckt, können die Firmen die Länder fleissig gegeneinander ausspielen.

Brandora, R/C X-UFO - hey, klasse. Ob das kräftig genug ist eine kleine Digitalkamera zu tragen?

Die Ausbildung wird verstaatlicht

DGB zum Ausbildungspakt: "Die Ausbildung wird verstaatlicht" - hat denn wirklich jemand geglaubt dieser absurde Ausbildungspakt würde die Wirtschaft dazu bewegen wirklich Ausbildungsplätze zu schaffen? Die sind doch garnicht daran interessiert selber auszubilden und sich damit die benötigten Fachkräfte zu schaffen. Wenn Fachkräfte fehlen ist es doch viel einfacher nach irgendwelchen bescheuerten Green-Card-Projekten zu schreien - und die Politik ist dumm genug dabei mitzuziehen. Und wenn man dann keine Leute mehr braucht, weil die Gewinne gestiegen sind, schmeisst man halt alles raus.

Eine Zwangsabgabe ist zwar problematisch - nicht wegen der Abgabe, sondern weil die Wirtschaftsbosse das wieder als fadenscheinige Ausrede benutzen um Leute zu entlassen weil sie ja angeblich sonst nicht konkurrenzfähig wären - aber warscheinlich die einzige Möglichkeit überhaupt die Wirtschaft dazu zu zwingen auszubilden.

Klar, die richtige Lösung wäre das die Wirtschaftsbosse mal wieder ihr Hirn einschalten und vielleicht sogar ihre soziale Verantwortung wiederentdecken. Aber wer glaubt noch an sowas in Zeiten von Esser und Ackermann? Oder dem Daimler-Chef ohne Rolex, aber mit verdoppeltem Gehalt bei schwindenden Gewinnen? Traut irgendwer diesen Abzockern wirklich auch nur rudimentäre soziale Kompetenz zu?

Das mit der Konkurrenzfähigkeit am internationalen Markt ist übrigens eine ziemliche Farce als Argument, wenn Deutschland in Serie den Export weiter ausbaut und Rekordgewinne in exportorientierten Branchen einfährt. Wie klappt sowas wohl, wenn unser System so wenig konkurrenzfähig ist im internationalen Markt?

Fischer wird NRW-Wahlkampfthema - Rüttgers muss ja ganz schön am Ende sein, wenn er sich statt Regionalthemen ein Bundesthema für den Wahlkampf greifen muss. Aber besonders gut geführter Wahlkampf hat ja noch nie zu seinen Stärken gehört. Nicht das es sonderlich schwer wäre regionale Themen zu finden - dafür liefert Rot-Grün in NRW einfach zu viele Vorlagen. Nur ist scheints die Union einfach zu dämlich das auszunutzen - vermutlich weil sie selber überhaupt keinen Plan hat wie die Probleme von NRW gelöst werden könnten. Aber die Klappe aufreissen und danach schreien gewählt zu werden, das können sie ...

::: heimstatt jochen wegner - BAUER POPPE UND DIE GOOGLEISIERUNG und die Verblödung des professionellen Journalismus. Wozu stellen die sich als sowas besonderes dar, wenn sie letztendlich nur genau das gleiche machen wie die Blogger? (via Schockwellenreiter)

Internet Explorer 7 beta due out this summer - und zwar wohl nur für Windows XP SP2. Na klasse. Damit werden die ganzen Müllhalden an kaputten Windows-Systemen draussen weiter mit den verkorksten IE-Versionen rummachen. Andererseits - wenn man sich so die Entwicklung von IE anguckt, will man dann überhaupt das sich eine neue Version verbreitet?

junge welt vom 15.02.2005 - Hungerlohn für Nachhilfe berichtet über die Verdrängung normaler Beschäftigungsverhältnisse durch Ein-Euro-Jobs. War ja zu erwarten, das auch diese Massnahme nicht wirklich Arbeitsplätze schafft, sondern letztendlich Arbeitsplätze vernichtet. Aber es ist schon ein Hohn, das unter den ersten die die Ein-Euro-Jobs missbrauchen die öffentliche Hand ist ...

Mozilla entfernt Unterstützung für Umlaut-Domains

Mozilla entfernt Unterstützung für Umlaut-Domains - meiner Meinung nach die einzig richtige Reaktion. Der IDN-Mist ist sowieso nur Moppelkotze ohne jeden wirklichen Sinn. Sorry, aber Umlautdomains die nur im Web funktionieren aber bei Mail nicht sind nur ein Debakel das darauf wartet stattzufinden. Und die technische Realisierung - das eben nur ein kleiner Ausschnitt aus Unicode überhaupt abbildbar ist - ist auch lächerlich. Alles nur um die Domainvermarktung anzukurbeln und irgendwelchen Deppen das Ego zu streicheln ...

Neohapsis Archives - Full Disclosure List - #0258 - [Full-Disclosure] Advisory: Awstats official workaround flaw - ich hab das Teil jetzt hinter einen Passwortschutz gepackt und Ende mit Exploits. Ohne entsprechende Absicherung kann man awstats.pl wohl vergessen - scheint ein klassischer Schweizer Käse zu sein ...

News.Individual.DE ab 1.4. nicht mehr kostenlos

Der Newsserver news.individual.de ist demnächst kostenpflichtig weil sich keine Sponsoren finden liessen. Den Hinweis habe ich über den Rabenhorst mitbekommen. Wirklich schade, das es nicht weiter kostenlos betrieben werden kann. Nunja, die Leistung des Servers ist so gut, die 10 Euro ist es mir allemal wert.

PageRank Echtheit prüfen

PageRank Echtheit prüfen - nettes kleines Online-Tool zur Prüfung des Pagerank mit gleichzeitiger Beurteilung über die Echtheit des Pagerank.

Was mich absolut fasziniert dabei: ich hab tatsächlich mit meinem Weblog einen Pagerank von 6 und mit der Homepage von PyDS einen Pagerank von 7. Wow.

It's cool, man!

phpOpenTracker ist ein Live-Access-Auswerter für Webseiten. Er kann direkt in PHP-Anwendungen integriert werden oder über Webbugs (kleine unsichtbare Grafiken) aus statischen Webseiten gesammelt werden. Man kann damit ziemlich viel über das Benutzerverhalten in den Webseiten erkennen. Und bei Asymptomatic wird gerade an einem WP-Plugin dafür gestrickt, mit dem man die entsprechenden Auswertungen im WP-Backend zu sehen bekommt ...

Weniger Politik für mehr GEZ-Gebühren [raben.horst]

Weniger Politik für mehr GEZ-Gebühren - na toll. Einige der wenigen Gründe überhaupt noch die öffentlich-rechtlichen Fernsehsender zu gucken - nämlich Sendungen wie Panorama, Monitor, Kontraste oder Report (sorry, aber auf Fakt kann ich verzichten - da kann ich auch die Blödzeitung lesen) - werden gekürzt. Weil die Tagesthemen verschoben werden - um mehr Platz für was weiss ich zu schaffen. Jedenfalls für nix was mich interessiert. Der einzige andere Grund der mir bei der ARD noch so spontan einfällt ist der Tatort. Und das wars dann auch schon ...

Wofür zahl ich nochmal GEZ-Gebühren?

WordPress 1.5 ist raus

und ich hab mal upgedated (ich hatte eine relativ aktuelle CVS-Version laufen). Ein ziemlicher Berg an Änderungen in den letzten 5 Tagen, aber scheinbar funktioniert alles weitestgehend. Bisher nur einen Bug gefunden und reported, aber auch noch nicht so viel hier getestet. Wem was komisches auffällt (ich mein damit komischer als es sonst hier ist), hier als Kommentar abladen oder über das Feedback-Formular melden.

Canon EOS 20Da, Japan Only - na, sowas wollen sicherlich auch die Astronomen ausserhalb Europa haben. Und ich denke mir mal das auch einige Infrarotfotografiebegeisterte daran Interesse haben könnten. Ich finds jedenfalls gut wenn auch ein bischen exotische Varianten von Digitalkameras existieren, auch wenn für mich wohl eher eine reine SW-Digi-SLR ohne Bayer-Filter interessant wäre (gabs mal von Kodak, leider alle eingestellt).

Cooperative Linux ist ein Linux-Kernel der als normaler Prozess innerhalb von Windows läuft. Weird.

Des oanzige was zählt auf dera Welt

Paula, oh Paula Mir fanga jeden Tag von vorn o Und des oanzige was zählt auf dera Welt, is a Geld Paula, Paula Es is zwar traurig aber es is wahr des oanzige was wirklich zählt auf dera Welt für di is Geld Duitam Ditam Ditam

Haindling, Paula

Es wirkt ein wenig wie Flucht

Es wirkt ein wenig wie Flucht wie sich in Dresden die Menschen verhalten. Alles orientiert sich im Bezug zu den Nazis. Aber wieso muss dieses Gedenken an den Angriff auf Dresden öffentlich gemacht werden?

Ja, der Angriff auf Dresden war fürchterlich - und in seiner Art warscheinlich sinnlos und übertrieben. Genauso wie der Hamburger Feuersturm. Oder andere Angriffe auf deutsche Städte. Hier in Münster wurde die Innenstadt zerlegt - die Militärkommandos waren aber am Rande der Innenstadt, gut durch Schloss und grossen Exerzierplatz auch aus der Luft kenntlich - und blieben unzerstört. Noch Fragen?

Aber was war der Anlass? Kann man einfach ignorieren das diese Angriffe ein direktes Resultat des Wahnsinns des Nationalsozialismus und des zweiten Weltkrieges waren? Ich bin der Meinung das die eigenen Toten des zweiten Weltkrieges etwas sind, das wir still betrauern müssen. Man kann nicht alles in die Öffentlichkeit tragen und trotzdem meinen man distanziere sich von denen die diese Ereignisse für ihren mentalen Müll instrumentalisieren wollen.

Die Familie meiner Mutter wurde in alle Winde zerstreut - viele getötet, verschleppt, viele sind an direkten und indirekten Kriegsfolgen gestorben. Trotzdem nehme ich keinem Polen, keinem Russen und keinem Alliiertem etwas übel - und wiege nichts davon gegen anderes Leid auf. Es wäre einfach Wahnsinn und eine gefährliche Überheblichkeit diese Verluste (und für das Individuum sind es natürlich Verluste) gegen die fatalen Folgen des deutschen Verhaltens aufzuwiegen.

Nein, manche Trauer muss still von statten gehen, ohne grosse Zeremonien. Denn genau dadurch kann man sich von den Nazis distanzieren - deren Instrumentalisierung funktioniert nur gerade weil die Menschen in Dresden ihre eigene Zerstörung in die Mitte einer öffentlichen Veranstaltung stellen. Und damit für den rechten Dreck eine Plattform bildet.

No Tears vor Krauts? Halte ich für falsch. Aber Tränen dürfen auch leise fliessen.

Etomite Content Management System

Das Etomite Content Management System(gefunden via Netbib) ist eine recht interessante Angelegenheit. Was mir an dem CMS nicht so gut gefällt: das Standardtheme. Sorry, aber das ist bunt und sieht für mich aus wie Windows . Ausserdem benutzt es ein Tabellenlayout, was mir auch nicht so gut gefällt. Aber ansonsten muss ich schon sagen, das Teil hat was. Das Backend vor allem ist sehr interessant - es benutzt massiv JavaScript und DHTML, was natürlich erstmal nicht so gut ist wenn man JavaScript nicht mag. Aber es bietet darüber eine ganze Menge interaktiver Features die sehr nett sind - zum Beispiel Feedback über die laufende Aktion, automatische Aktualisierung der diversen Oberflächenelemente und insgesamt eine recht runde Bedienung.

Auch gut gefällt die Idee der Snippets - sowas wie in PyDS die Nuggets. Kleine Schnipsel von Code die man einfach in der Datenbank speichert und die dann über Tags in den Templates abgerufen werden. Sehr praktisch, da man so oft einfache kleinere Erweiterungen bauen kann, ohne extra ein grosses Rad zu drehen.

Ebenfalls recht interessant ist das automatische Caching - nichts wirklich neues, aber in diesem Fall eine nette Idee: man kann an den Elementen selber festlegen ob sie gecached werden sollen oder nicht. Und zwar für jedes Element einzeln. Deutlich besser als die üblichen Sekt-oder-Selters-Ansätze anderer CMS.

Insgesamt ist Etomite wesentlich stärker Full-CMS-orientiert als Blog-orientiert. Das stellt es funktional eher in eine Gruppe mit Drupal als z.B. WordPress. Es gibt auch schon eine Reihe von Snippets zur einfachen Erweiterung, genauso wie Themes. Auch verschiedene Sprachfiles existieren schon. Die Dokumentation existiert auch schon, ist sogar nach erstem überfliegen schon recht brauchbar für den Start.

Die Lizenz ist GPL, was schon mal gut ist. Allerdings kommt beim ersten Login ein spezieller Hinweis, der nicht entfernt werden darf - eigentlich beisst sich sowas mit der GPL, denn die GPL sagt ja gerade das ich mit dem Paket alles mögliche machen darf, sofern ich den geänderten Source zur Verfügung stelle. Ok, ich darf nicht behaupten das es von mir ist und muss ursprüngliche interne Copyright-Hinweise erhalten, aber ansonsten kann ich alles ändern. Und das umfasst normalerweise auch Hinweistexte. Zwangslinks und Zwangshinweise beissen sich nunmal mit der GPL. Entweder muss man dann die GPL explizit um diesen Hinweis erweitern - womit es eine GPL+Zusatz wird, die dann allerdings zur normalen GPL inkompatibel wird - oder man verkneift sich Zwangshinweise. Das ganze ist ein nicht unbekanntes Problem der Leute mit der GPL, aber stören kann sowas bei kommerziellem Einsatz definitiv.

Hat jemand Kubrick auf Etomite portiert? Ich bräuchte für meine Spielereien noch ein etwas hübscheres Theme als das mitgelieferte

Filter soll Internet-Filmtausch stoppen

Filter soll Internet-Filmtausch stoppen - weitere Moppelkotze der Rechteverwerter. In diesem Fall frag ich mich allerdings, was sie dem Journalisten für diesen Artikel bezahlt haben, selten sowas tendenziöses gelesen in der Netzzeitung. Egal, Mumpitz ist es allemal - wer Files schieben will, wird es machen. Ohne das irgendwelche Filter oder Signaturen an den Dateien dabei irgendetwas verhindern. Dieses ganze Filtergelaber und die ganzen Verfahren der Filmindustrie und Musikindustrie ist doch nix weiter als vorpubertäres Rumstolzieren im Sandkasten. Guck mal meine Muskeln, boah watt bin ich cool. Dahinter steckt dann nur ein kleines Bürschen das von nix Ahnung hat.

Eine Lösung? Hab ich nicht. Ist auch nicht mein Job. Ich sitz nur am Rand und lach mich über diese ganzen tollen Lösungsansätze schlapp, deren kindlicher Optimismus maximal noch vom Glauben an Weihnachtsmann und Osterhase übertroffen wird. Zu Zeiten von Techniken wie Onion Routing und Peer-2-Peer-Netzen wie Freenet ist es jedenfalls albern zu glauben man könne mit Filtern und Überwachungen was erreichen. Das einzige was man erreicht: die angesprochenen Techniken werden immer besser. Letzten Endes sogar ein positiver Effekt - wenn auch nicht der, den sich die Rechteverwerter vorstellen.

Ärgerlich an der ganzen Sache ist nur, das auch die guten Filetransfertools wie Bittorrent Ärger kriegen, weil ein paar Geldsäcke nicht kapieren wollen das der Zug für sie abgefahren ist und sie einfach zu blöd waren einzusteigen. Und das sich immer wieder Politiker nicht entblöden sich vor diese Industrie mit ihren absurd aufgepumpten Gewinnmargen spannen zu lassen.

Die Künstler? Sorry, Kinners, aber irgendwann müsst ihr der Realität mal ins Auge sehen: die Verlage zocken euch ab und sind einen Dreck an euch und euren Gewinnen interessiert. Also setzt euch lieber zusammen und baut gemeinsam was auf - das an den bisherigen Verwertern vorbei geht. Nutzt die Chancen des Internet direkt an eure Zuhörer und Zuschauer zu kommen. Ja, das heisst das sich das System Kunstverwertung ändern muss - muss es aber sowieso.

Aber vermutlich müssen wir erstmal noch ein paar Jahren menschenverachtende Werbebotschaften (Privatkopierer = Kinderschänder) und menschenverachtende Gesetzgebung (Verbot der Privatkopie, generelle Kriminalisierung von Internetbenutzern) über uns ergehen lassen, bis die Rechteverwerter an ihrer Arroganz und Unfähigkeit eingegangen sind. Dann gibts vielleicht eine Chance auf Neuanfang.

Freitag 06 - Die Plünderer kommen

Freitag 06 - Die Plünderer kommen. Vom Ausverkauf des Wirtschaftsstandorts Deutschland durch die Arroganz, Dummheit und Borniertheit der Politiker und Wirtschaftsbosse in Deutschland:

Mögen Politiker wie Schröder noch so oft von wichtigen Investitionen für den Standort Deutschland reden und die Arbeitsplätze beschwören, die dadurch geschaffen werden - die Wirklichkeit sieht anders aus. "Die Statistik trügt", stellt das Handelsblatt fest. "Der steile Anstieg der Investitionen ist durch Fusionen und Firmenübernahmen geprägt. Und die haben unterm Strich mehr Arbeitsplätze vernichtet als neue geschaffen." Dies hindert dieselbe Zeitung ebenso wenig wie die Bundesregierung, die zielstrebigen Jongleure der Wall Street willkommen zu heißen, die man in den USA einfach "Raider", Plünderer, nennt. Völlig falsch - sagt der Bundeskanzler. Diese Firmen haben "Mut, Prinzipien und Visionen".

Wie stehts in Uhus Weblog so schön:

Wirtschaft - zumindest auf lange Sicht - den Menschen dienen muß, das Prinzip der Wirtschaft um der Wirtschaft Willen aber illegitim und somit irrsinnig ist?

Tja. Nur wer erklärt das dem Industriekanzler und seinen Schergen? Oder den ganzen anderen Trollen, die auf ihren Geldsäcken sitzen und nur drauf gucken das ihr Sack grösser und fetter wird? Arbeit muss sich lohnen - das ist das einzige was man von der Richtung hört. Ja, richtig - aber wenn sich die Arbeit der Mehrheit der Gesellschaft nur für eine kleine Minderheit lohnt, der Teil der die Arbeit macht aber in den Arsch getreten wird - dann ist was oberfaul. Und wenn Arbeit muss sich lohnen so umdefiniert wird, das es eigentlich Such dir Arbeit, egal wie beschissen, sonst verreckst du bedeutet, dann sind wir über die Grenzen einer sinnvollen Gesellschaftsordnung schon hinaus. Und deshalb hat der Uhu warscheinlich Recht: erstmal muss es wieder knallen. Nur knallt es in Deutschland oft auf die denkbar widerlichste Art und Weise - und die Ansätze zu einem sinnvollerem Knall werden einfach umgebracht ...

Howstuffworks "How Van de Graaff Generators Work" erklärt wie statische Elektrizität funktioniert und wie man mit einem Van de Graaff Generator welche produzieren kann. Cool. Britzel

javascript:xmlhttprequest [JPSPAN] - XMLHttpRequest ist das, was GMail und andere Webanwendungen mit hoher Interaktivität zum Ticken bringt. Integration von JavaScript Code mit Server Code über kleine HTTP-Requests die dann nur Teile der Seite aktualisieren.

Auch die Norweger kriminalisieren jetzt Musikbesitzer - auf eine auch noch ausgesprochen bescheuerte Weise: private Kopien bei Erhalt des Mediums (CD auf CD) sollen weiter erlaubt sein, aber Medienwechsel soll verboten sein - also Umsetzen einer CD auf einen MP3-Player zum Beispiel, wenn die ursprüngliche CD kopiergeschützt war. Was für eine hirnverbrannte Idee. (via Schockwellenreiter)

Sigma: 30-mm-Objektiv mit F1.4 für Digitalkameras - könnte für meine 10D ganz interessant sein, der Bildwinkel liegt schön nah an der bei mir so beliebten Normalbrennweite und die Lichtstärke ist ein ganz klares Plus. Andererseits bleibt natürlich die Frage ob das Bokeh des Objektives Sigma-typisch - also beschissen - ist ...

Vytorin Self-Stirring Mug - voll bekloppt. Eine Tasse mit eingebautem Umrührer. Wozu sollte man so einen Mist brauchen? Wenigstens hat die Tasse keinen USB-Anschluss ...

Wacom Cintiq 21UX Touch Screen Flat-Panel - geil. 21-Zoll Display mit Touchscreen und Grafikpad-Funktion. Endlich direkt mit Stiften auf dem Display malen. Hat jemand mal 2500 Dollar für mich über?

Wie man den geografischen Ort aus einer dynamischen IP-Adresse ermittelt. Autsch. Klar, die Provider haben ja für ihre dynamischen Einwahlknoten auch wieder Namen von Routern etc., alsom muss die Information irgendwie daraus ermittelbar sein. Soviel zum Thema anonym durch dynamische Einwahl ...

Aus gegebenem Anlass ...

... weise ich darauf hin das ich Trackbacks von Blogs einfach lösche, wenn deren einziger Zweck die Promotion von irgendwelchen obskuren Amazon-Shops ist. Sorry, aber bloss weil der Werbemüll in einer Weblogsoftware abgelegt ist heisst das nicht, das ich jeden unpassenden Trackback durchwinke. Und nein, nur weil ein Stichwort aus dem Posting auch bei mir in einem Posting vorkommt ist das noch lange kein interessanter Trackback sondern einfach nur Spam.

CSS und IE und Safari 1.0

Ich poste ja immer mal wieder Source-Schnipsel und Logfileauszüge und son Zeug. Dafür benutze ich das PRE Tag, damit der Kram vorformatiert angezeigt wird und in einem monospaced Font. Mit alle Browsern klappt das gut. Nur machen mir da ein paar Browser ziemlich Ärger. Und zwar zum Einen Safari 1.0 - ok, der stirbt zwangsweise aus und ist nur in sofern ein Problem, als das der horizontale Scrollbalken die unterste Zeile überschreibt. Das kann man notfalls mit einer Leerzeile ausgleichen.

Aber IE für Windows zickt auch rum - User sagen mir, das die Breite immer komplett ist, ohne Scrollbalken. Ich hab hier kein Windows, ich kann das hier nicht testen, aber doof wär das natürlich schon - ich kann so in der Frontseite keine PRE benutzen, sonst zerfetzt es das Layout.

Ganz krass ist der IE 5.5 Mac: der blendet die PRE komplett aus. Und ich kapier nicht warum. Die werden schlicht und einfach nicht angezeigt. Die Seite validiert natürlich. Nunja, der IE Mac 5.5 ist hoffentlich auch bald ausgestorben und die armen Würstchen die den noch benutzen haben mein Bedauern, aber eben keine Sourcen

Aber für den Windows IE wär ich für einen Tipp zum CSS Problem dankbar. Sofern man das mit normalen CSS-Mitteln und ohne allzu heftige Hacks fixen kann, könnte ich das ja einbauen. Hier ist ein Beispielartikel mit PRE-Blöcken.

Gravatars in den Kommentaren

So, ich hab in den Kommentaren mal Gravatars eingebaut. Wer einen hat, wird jetzt mit Bild angezeigt. Im Moment ist es aber noch etwas mau mit der Verbreitung von Gravataren - ich find die irgendwie witzig, dadurch werden Kommentatoren etwas persönlicher erfassbar. Nicht nur anonyme Namen im Hintergrund.

Da Gravatare ja aufgrund der eingegebenen eMail-Adresse herangezogen werden: diese wird bei mir auf keinen Fall veröffentlicht. Gravatare benutzen einen MD5-Hash der eMail-Adresse, aus dem Link ist also die Adresse nicht rekonstruierbar. Und auch ansonsten wird in WordPress die eMail nirgends veröffentlicht.

Wer aber trotzdem seine normale Adresse nicht eingeben will: ich hab noch 50 Google-Mail-Invites über, wer mir über mein Feedback-Formular eine Nachricht zukommen lässt kann einen kriegen und den dann benutzen. Google-Mail hat einen recht brauchbaren Spam-Filter und mit 1 GB Plattenplatz dauerts sehr lange bis der voll gelaufen ist, wenn man ihn nicht ausleert. Ideal also als Wegwerf-Account ...

Und wer auch das nicht will, der kriegt halt mein Default-Gravatar verpasst und sieht dann eben etwas blass aus

Jens Voigt räumt bei der Mittelmeer-Rundfahrt ab - und zeigt damit, das wir wohl auch dieses Jahr wieder mit super Leistungen von ihm bei der Tour rechnen dürfen. Klasse Saisonstart.

mozdev.org - conkeror

Das nenne ich Aufopferung - n der Dokumentation zu einem rein tastenbedienten Mozilla:

You should never have to reach for your mouse. To make sure Conkeror remains pure, I do not own a mouse.

Wer also Maus-Phobiker ist, kann sich vielleicht mit dem Browser Erleichterung verschaffen.

Und weil ich ein experimentierfreudiges Kerlchen bin, hab ich das natürlich gleich mal ausprobiert. Ok, Emacs-Tastenbelegungen stinken (hey, ich bin VI-Man ) aber trotzdem ist das ganze durchaus benutzbar - man könnte sich dran gewöhnen, wenn denn die anderen Anwendungen im System eine ähnliche Bedienung hätten. Und noch ein Tipp für Mac-User: ja, das ganze funktioniert auch bei euch. Allerdings müsst ihr ja den Browser mit einem Parameter starten, der wird aber von Firefox.App nicht unterstützt. Statt dessen einfach folgendes Kommando im Terminal eintippen (Achtung, eine Zeile!): /Applications/Firefox.App/Contents/MacOS/firefox -chrome chrome://conkeror/content

Eventuell muss der Pfad zur Firefox.App angepasst werden. Danach geht ein kleines Fenster mit einer recht spartanisch gehaltenen Hilfedatei auf. Gut durchlesen, denn wenn man sich nicht wenigstens merkt wie man die Hilfeseite aufruft, wirds eng. Das grosse B geht zurück in der History, wenn ihr euch also vertüddelt, damit kommt ihr immer wieder zur Hilfe. Achja, und beenden geht nicht mit Apfel-Q - schliesslich ist es ja Emacs. Also die beiden Tasten Ctrl-X und C nacheinander drücken.

Wenn Suchmaschinenpromoter nix finden...

Und nochmal Logfiles

Da ich ja nun ein interessantes Studienobjekt hatte, wollte ich mal gucken inwieweit ich mit ein bischen Clusteranalyse in meinen Logfiles irgendwas interessantes zutagefördern würde. Ich habe also eine Matrix angelegt aus Referrern und zugreifenden IP-Adressen und mir damit mal einen Überblick über typische Userszenarien gemacht - also wie sehen normale User aus im Log, und wie sehen Referrer-Spammer aus und wie sieht unser Freund aus.

Alle drei Varianten lassen sich gut unterscheiden, auch wenn ich im Moment da noch eher davor zurückschrecken würde das algorithmisch zu fassen - das lässt sich nämlich alles recht gut simulieren. Trotzdem sind ein paar Auffälligkeiten zu sehen. Zuerst mal ein ganz normaler Benutzer:


aa.bb.cc.dd: 7 Zugriffe, 2005-02-05 03:01:45.00 - 2005-02-04 16:18:09.00
 0065*-
 0001*http://www.tagesschau.de/aktuell/meldungen/0,1185,OID4031994 ...
 0001*http://www.tagesschau.de/aktuell/meldungen/0,1185,OID4031612 ...
 0001*http://mudbomb.com/archives/2005/02/02/wysiwyg-plugin-for-wo ...
 0001*http://www.heise.de/newsticker/meldung/55992
 0001*http://log.netbib.de/archives/2005/02/04/nzz-online-archiv-n ...
 0001*http://www.heise.de/newsticker/meldung/56000
 0001*http://a.wholelottanothing.org/2005/02/no_one_can_have.html

Man sieht schön wie dieser User von meinem Weblog weggeklickt hat und wieder zurückgekommen ist - die Referrer sind nämlich mitnichten alles Links auf mich, sondern falsche Referrer die die Browser schicken, wenn der Benutzer von einer Site auf eine andere wechselt. Eigentlich sollen Referrer ja nur dann geschickt werden, wenn auch wirklich ein Link geklickt wird - kaum ein Browser macht das aber richtig. Der Besuch war an einem definierten Tag und er ist direkt eingestiegen durch Eingabe des Domainnamens (die "-" Referrer stehen oben und oben steht der früheste Referrer der vorkommt).

Oder hier mal ein Zugriff von mir:


aa.bb.cc.dd: 6 Zugriffe, 2005-02-04 01:11:56.00 - 2005-02-03 08:27:09.00
 0045*-
 0001*http://www.aylwardfamily.com/content/tbping.asp
 0001*http://temboz.rfc1437.de/view
 0001*http://web.morons.org/article.jsp?sectionid=1&id=5947
 0001*http://www.tagesschau.de/aktuell/meldungen/0,1185,OID4029220 ...
 0001*http://sport.ard.de/sp/fussball/news200502/03/bvb_verpfaende ...
 0001*http://www.cadenhead.org/workbench/entry/2005/02/03.html

Ich erkenne mich daran, das Referrer mit temboz.rfc1437.de vorkommen - das ist mein Online-Aggregator. Sieht ähnlich aus - ne Menge falsch geschickter Referrer. Noch ein anderer User:


aa.bb.cc.dd: 19 Zugriffe, 2005-02-12 14:45:35.00 - 2005-01-31 14:17:07.00
 0015*http://www.muensterland.org/system/weblogUpdates.py
 0002*-
 0001*http://www.google.com/search?q=cocoa+openmcl&ie=UTF-8&oe=UTF ...
 0001*http://blog.schockwellenreiter.de/8136
 0001*http://www.google.com/search?q=%22Rainer+Joswig%22&ie=UTF-8& ...
 0001*http://www.google.com/search?q=IDEKit&hl=de&lr=&c2coff=1&sta ...

Dieser kam öfter (also mehrere Tage) über meine Update-Seite auf muensterland.org und zusätzlich hat er noch nach Lisp-Themen gesucht. Und vom Herrn der Schockwelle ist er auch mal gekommen. Absolut typisches Verhalten.

Jetzt mal im Vergleich ein typischer Referrer-Spammer:


aa.bb.cc.dd 6 Zugriffe, 2005-02-12 17:27:27.00 - 2005-02-02 09:25:22.00
 0002*http://tramadol.freakycheats.com/
 0001*http://diet-pills.ronnieazza.com/
 0001*http://phentermine.psxtreme.com/
 0001*http://free-online-poker.yelucie.com/
 0001*http://poker-games.psxtreme.com/

Alle Referrer sind direkte Domain-Referrer. Keine "-" Referrer - also keine Zugriffe ohne Referrer. Keine sonstigen Zugriffe - würde ich es genauer analysieren nach Seitentyp, würde auffallen das keine Bilder etc. zugegriffen werden. Leicht zu erkennen - sieht einfach mager aus. Typisch ist auch das jede URL nur einmal oder zweimal angegeben ist.

Jetzt unser neuer Freund:


aa.bb.cc.dd: 100 Zugriffe, 2005-02-13 15:06:16.00 - 2005-02-11 07:07:55.00
 0039*-
 0030*http://irish.typepad.com
 0015*http://www208.pair.com
 0015*http://blogs.salon.com
 0015*http://hfilesreviewer.f2o.org
 0015*http://betas.intercom.net
 0005*http://vowe.net
 0005*http://spleenville.com

Was auffällt sind die Referrer ohne abschliessenden / - untypisch für Referrer-Spam. Ausserdem halt ganz normale Sites. Was auch auffällt, es werden Seiten zugegriffen ohne Referrer - dahinter verstecken sich die RSS-Feeds. Auch dieser ist also leicht von Usern zu unterscheiden. Vor allem da ein gewisser Rhythmus drin ist - scheinbar immer 15 Zugriffe mit einem Referrer, dann den Referrer wechseln. Entweder ist die Referrer-Liste recht klein, oder ich hatte Glück das er zweimal den gleichen bei mir probiert hat - einer ist nämlich 30x da.

Normale Bots braucht man nicht gross zu vergleichen - die wenigsten schicken Referrer mit und sind deshalb völlig uninteressant. Ich hatte einen, der mir aufgefallen war:


aa.bb.cc.dd: 5 Zugriffe, 2005-02-13 15:21:26.00 - 2005-01-31 01:01:07.00
 2612*-
 0003*http://www.everyfeed.com/admin/new_site_validation.php?site= ...
 0002*http://www.everyfeed.com/admin/new_site_validation.php?site= ...

Eine neue Suchmaschine für Feeds die ich noch nicht kannte. Scheinbar hat der Admin gerade vorher irgendwo meine Adresse eingetragen und dann hat der Bot losgelegt die Seiten zu sammeln. Danach hat er dann im Administrationsinterface meine von ihm neu gefundenen Feeds freigeschaltet. Scheint ein kleines System zu sein - der Bot läuft von der gleichen IP wie das Administrationsinterface. Die meisten anderen Bots kommen von ganzen Botfarmen, Webspidern ist halt eine aufwändige Sache ...

Zusammenfassend lässt sich also feststellen, das die derzeitige Generation von Referrer-Spammer-Bots und anderen Mal-Bots noch recht primitiv aufgebaut ist. Sie benutzen keine Botnetze um viele unterschiedliche Adressen zu verwenden und sich dadurch zu verstecken, sie benutzen reine Server-URLs statt Seiten-URLs und haben auch sonst recht viele typische Kennzeichen wie z.B. bestimmte Rhythmen. Ausserdem kommen sie fast immer mehrfach.

Leider sind das keine guten Merkmale um sie algorithmisch zu fassen - ausser man lässt seine Referrer in eine SQL-Datenbank laufen und prüft jeden Referrer mit entsprechenden Selects auf die typischen Kriterien. Darüber könnte man dann durchaus die üblichen Verdächtigen erwischen und gleich auf dem Server blocken. Denn normale User-Zugriffe sehen deutlich anders aus.

Allerdings sind auch schon neue Generationen in der Mache - wie mein kleiner Freund, der mit dem fehlenden /, zeigt. Und dank der dämlichen Browser mit ihren falsch erzeugten Referrern (die viel mehr über die History des Browsers aussagen als über tatsächliche Link-Verfolgung) kann man nicht einfach die referenzierten Seiten gegenchecken, da viele Referrer reine Blindreferrer sind.

vermutlich verkleideter Bot in den Logs

Ich hab gerade mal in meinen Referrern einige Referrer gefunden, auf denen ich absolut nichts finden konnte das auf mich verweist. Soweit nichts ungewöhnlich - Referrer-Spam wäre die erste Vermutung. Aber die in den Referrern genannten Seiten sind ganz normale Weblogs und andere Sites - keine Leute die Grund hätten für ihre Site zu spammen (zum Beispiel ein Blog mit ca. 1 Post pro Monat, oder eine Irin und noch so ein paar seltsame Referrer). Auch sind die Anzahlen anders als bei normalem Referrer-Spam: der kommt normalerweise entweder nur 1-2x oder wenn dann mit vielen Adressen und jede dann gleich 100x oder ähnliches. Dieser kommt ca. 15 mal.

Also habe ich mal in den Logs etwas gewühlt, ob ich da was finde. Und siehe da, die Referrer haben ungwöhnliche Merkmale: sie schliessen nicht mit einem / ab. Normalerweise wird eine Adresse die nicht auf / endet automatisch umgeleitet auf die /-Variante. Referrer sind also normaleweise /-terminiert oder direkte HTML-Seiten oder etwas vergleichbares. Reine Site-Angaben ohne / hinten dran sind eher selten.

Auch noch was anderes fällt auf: die Seiten wurden wirklich angesurft - bzw. mindestens runtergeladen. Und die zu einem Referrer gehörigen Seiten sind recht wild gewürfelt - bei normalen Usern erwartet man eigentlich eher irgendeine Form von Konsistenz in dem was per Referrer rüberkommt. Vor allem kommen selten 15 Links auf einen Schlag auf eine Seite ...

Und das wesentliche Kriterium: die IP des zugreifenden Rechners ist bei den verschiedenen immer die gleiche. Eine Auswertung ergab dann folgendes Bild:


 15 betas.intercom.net
 15 blogs.salon.com
 15 hfilesreviewer.f2o.org
 30 irish.typepad.com
 5 spleenville.com
 5 vowe.net
 15 www208.pair.com

Alles eindeutig falsche Referrer. Zusätzlich noch 34 Zugriffe auf meine RSS-Feeds ohne Referrer. Zugriffe waren nur auf direkte Postings und RSS-Feeds - nicht auf Übersichtsseiten oder Archivseiten. Sieht sehr danach aus, das der Bot hier wie folgt vorgehen: RSS-Feeds suchen, diese abgreifen, da drin dann nach Permalinks auf Artikel suchen und diese runterziehen um z.B. an die Kommentarformulare zu kommen. Das ganze schön getarnt als angebliche Besucher, inkl. gefälschten Referrern die unverdächtig wirken. Auch nicht zu viele zugriffe eines Referrers, lieber das ganze öfter gewechselt.

Eigentlich nichts neues, beim eMail-Spam sind ja gefälschte echte Absender durchaus üblich und gängig um schwerer zu filtern zu sein. Aber bei Sammelbots sehe ich diese Art der Mimikry zum ersten Mal life - die Symptome beobachte ich auch erst ca. 1-2 Wochen bei mir.

Für Admins ist das ganze natürlich ziemlich nervig, da man die Referrer-Logs noch weniger gebrauchen kann als bisher schon. Bisheriger Referrer-Spam war zwar ein Ärgernis, aber aufgrund der ziemlich dämlichen Namen der Referrer leicht zu erkennen. Diese Form von Logphänomen verfälscht auch die Referrer - fällt aber wesentlich weniger auf. Könnte für Weblogs interessant sein die ihre Referrer direkt im Beitrag anzeigen.

Und natürlich bleibt auch noch das Problem, das ich ja noch nicht weiss was der Bot mit den gesammelten Erkenntnissen anfangen will. Wobei ich stark auf Spam tippe, aber das ist nur eine Vermutung - könnte auch ein Bot sein, der nach typischen Sicherheitslöchern sucht. Auf jeden Fall ist es ein Bot und auf jeden Fall hat er nichts gutes vor - denn sonst bräuchte er sich nicht zu verstecken.

Was guckst du?

Was guckst du?

Was guckst du?

Ein Reposting eines alten Bildes aus 2002 - in der Nähe von Husum. Ich spiele gerade mit meinem neuen Photo-Plugin für WordPress rum und brauchte Testmaterial.

Passend zu meinem vorigen, längeren, Text: Weblog Tools Collection leidet unter Referer Spam DoS. Solche Vögel - also Referrer-Spammer die in die Tausenden gehen bei den Zugriffen - sind in meiner Loganalyse (noch?) nicht aufgetaucht.

Wie man CSS DropShadows erzeugt. Könnte ich mir für meine Fotos vorstellen. Zickt aber rum bei IE 5.5 für Mac OS X. Ausserdem sind DropShadows eh nur was für Warmduscher und Weichspühler

DGB-Chef akzeptiert Umbau des Sozialstaats

DGB Chef akzeptiert Umbau des Sozialstaats und macht damit die Gewerkschaften obsolet. Hier hatte ich einen längeren Text geschrieben, aber irgendwie hab ich nach meiner aktuellen Inhaltsvernichtung den nicht mehr parat. Wenn jemand den noch im RSS-Reader stecken hat, bitte melden, ansonsten ist er halt futsch.

Neue Polaroid 600 SE

Neue Polaroid 600 SE

Neue Polaroid 600 SE

Ich hab mir eine neue Polaroid 600 SE gekönnt. Meine alte ist ja sehr lädiert - halt vom Grabbeltisch, defekter Drahtauslöser, Macken, Dellen etc. Die neue ist wie aus dem Ei gepellt. Und es war sogar noch das 127er dabei, das mir ja bisher fehlte. Nette Optik, vor allem eine wesentlich sinnvollere Nahgrenze als beim 150er. Und das Ergebnis kann sich auch sehen lassen - ich mag einfach Polaroids. Allerdings war mein Scanner nach langer Nicht-Benutzung ziemlich verstaubt und natürlich war der Staub nicht plötzlich von ein paar mal wischen weg. Im Ergebnis waren also haufenweise Staubfädchen zu sehen. Naja, Photoshop und das Polaroid Dust&Scratch Removal Plugin haben das Bild weitestgehend gerettet. Allerdings mache ich mir die Polaroids sowieso normalerweise nicht zum Scannen, sondern fürs Fotoalbum. So richtig altmodisch, mit Pappblättern, Pergament-Deckblättern und so …

Nicht über den Inhalt meines Weblogs wundern ...

... da ist nur ein amoklaufender Admin mit einem saublöden Script drübergedengelt und hat alle Inhalte vernichtet. Wird irgendwie alles wieder rekonstruiert und repariert und gebügelt und gefaltet. Irgendwie. Und danach stell ich mich in die Ecke und geissel mich ...

Update: jetzt ist alles wieder weitestgehend restauriert. Was war passiert: ich habe von Exhibit für die Bilder auf ein eigenes Plugin umgestellt. Und dabei halt per Script alle Postings mit Bildereinträgen umgeschrieben. Bei dem generierten UPDATE habe ich aber dummerweise die WHERE-Klausel vergessen ...

Verluste: mein Posting zum DGB und die Formulierungen in den Postings von heute. Alles andere war aus einem Backup zu rekonstruieren. Und ein paar Nerven. Und mir zum x-ten Mal hinter die Ohren geschrieben, das ich demnächst vor der Bastelei einen aktuellen Backup machen sollte. Was natürlich nix nutzen wird, weil hinter den Ohren kann ich ohne zwei Spiegel nicht lesen ...

Update 2: und natürlich war ich so klasse bei der Rekonstruktion des Weblogs die geänderten Bilderpostings auch zu überschreiben, weshalb jetzt sämtliche Beiträge im Bilderblog ohne Fotos sind. Ich fasse es nicht. Irgendwie ist heute Vollmond oder sowas ...

Was bedeutet, das ich noch mal kreativ werden muss, um die Bilder wieder in die Postings zurückzupulen, denn natürlich habe ich mir die Zuordnungstabellen alle gelöscht, da ich diese ja nicht mehr brauche. Aber die hab ich ja alle noch im Backup, so schlimm wie vorher wirds also nicht

Update 3: jetzt sollte alles wieder weitestgehend so sein wie vorher. Und die letzte Reparatur ging tatsächlich ohne grössere Katastrophen von statten

Was einen erwartet wenn man MySQL 4.0 auf 4.1 aktualisiert. Ok, Datenbankversionsupgrades sind nie einfach und können immer mal Probleme machen.

WordPress Localization beschreibt wie man eigene Übersetzungen für WordPress erstellt.

Anrufbeantworter nehmen R-Gespräche an. Schnell mal meinen Anrufbeantworterspruch checken ...

Microsoft Interoperability

Ian Bicking beschreibt was Microsoft Interoperability wirklich heisst. Ein Zitat des Support-Mitarbeiters von Microsoft:

Microsoft isn't in the business of integrating with non-Microsoft software.