Wadoku
Was ist Wadoku? Wadoku, alternativ: WaDoku oder WaDokuJT, (japanisch 和独辞典 Wadoku Jiten, deutsch ‚japanisch-deutsches Wörterbuch‘) ist ein kostenloses japanisch-deutsches Online-Wörterbuch, welches man auf https://www.wadoku.de/ finden kann. Die Daten sind frei erhältlich. Der Datenbestand ist z.z. bei 399'321 Haupteinträge. (Stand Januar 2021)
Der Weg ist das Ziel

Tabelle | Beschreibung | Anz. Datensätze |
Haupttabelle | Hira/Hatuson schreibweise mit Romaji und Zähler für Unterkategorien | 399'321 |
Etym | Herkunft eines Wortes | 66'709 |
Gramatik | Substantive (Hauptwörter, Nomen), Adjektive (Eigenschaftswörter), Verben usw. | 260'066 |
Midashigo | Kurzfassungen für die Schreibung der japanischen Einträge | 666'291 |
Ref | (Quer)Referenzen | 257'972 |
Ruigos | Weiterführende Einträge | 92'551 |
Senses | Beispielsätze (Einzeleinträge) mit der deutschen Übersetzung | 1'217'988 |
Senses Cache | Beispielsätze (1:1 zur Haupttabelle) | 399'321 |
Wortliste | Anhand der Beispielssätze erstelle Wortliste für Vorschläge (Suggestion) | 816'771 |
Damit die Performance für die Beispielsätze (1:n) verbessert wird habe ich diese in eine Caching-Tabelle zusammengefasst und stellen eine 1:1 Beziehung. Mit ~160Mb auch die grösste Tabelle.
utf8mb4
Bis jetzt kam ich mit mit utf8mb4 in Berührung da ich sonderlich nicht viel mit erweiterten Zeichensatz arbeitete. Jetzt mit japanischen Zeichen musste ich zuerst meine Datenbank Connector ein wenig umschreiben das ich den Zeichensatz für die Verbindung mitgeben konnte und des weiteren das Verständnis wie man char[] in C# benützt um zu anlysieren in welchem Charset code das Zeichen steht.
Powershell und mysql
Ich musste leider feststellen das Powershell nicht ganz mit allen Zeichensätzen umgehen kann. So quittiert der "normale" Befehl mit einer Fehlermeldung das < für eine Funktion vorreserviert ist. Auch über das Cmdlet Get-Content waren die Zeichensätze falsch. Mit folgendem Poweshellbefehl (via CMD) war ich für das Importieren eines MySQL Dump erfolgreich:
$file="[path-of-file]" cmd /c 'mysql.exe -h [dbhost] -u[user] -p[pw] --default-character-set=utf8 [database] < '$file
Romaji <> Japanisch
Lateinische Buchstaben werden in Japan ebenso verwendet, z.b. bei Firmennamen, als Lesehilfe für Ausländer an Bahnhofsschildern usw. In Japan werden diese Zeichen Romaji genannt. Es gibt verschiedene Varianten eine japanische Silbe mit Romaji zu schreiben, was aber bei vielen gemeinsam ist, das sie sich an das Englische anlehnen. Romaji ist keine 1:1 übersetzung aus dem Japanischen, denn eine Romaji Übersetzung kann man nicht immer zurück in das japanische konvertiert werden. Wadoku bietet hier auch keinen Export von Romaji. Hier musste ich mir eine C# Library WanaKanaSharp zu hilfe nehmen und um das modifizierte Heburn-System erweitern. Diese ist nun in meiner Lösung durchsuchbar.
Die erste Beta-Version:
Nach einigen Wochenden habe ich die erste Beta-Version fertiggestellt. Dabei musste ich Feststellen das die MySQL Version 8.x um den Faktor 2 lagsamer ist. Hier werde ich noch sicher ein paar Versuche starten um herauszufinden woran das genau liegt. Ich bin eigentlich mit dem Resultat zufrieden und hat umgmein Spass gemacht diese umzusetzen. Viel Spass beim Ausprobieren:
...auch noch interessant
- tool // 20.05.2024FontForge: Firefox Konsole Error: downloadable font: maxp: Bad maxZones: 0 beheben
- tool // 23.04.2024KomorebiCms (v5)
- tool // 29.02.2024there is a problem with windows installer package. A DLL required for this install to complete could not be run
- mysql // 09.02.2024MySQL: Japanisch konvertieren zwischen HEX, Decimal code point, UNICODE characters bytes
Tippsammlung
Kleine Tippsammlung für mich und dijenige die sich auf meine Webseite verirrt haben.Archiv
- Jun 2024 (1)
- May 2024 (1)
- Apr 2024 (2)
- Feb 2024 (3)
- Jan 2024 (1)
- Sep 2023 (1)
- Jul 2023 (1)
- Apr 2023 (1)
- Feb 2023 (1)
- tipps (31)
- synology (27)
- linux (22)
- Windows (19)
- tool (19)
- Powershell (15)
- Windows 10 (13)
- csharp (c#) (10)
- coding (9)
- Ubuntu (6)
- security (6)
- ad (6)
- Windows 2012 R2 (5)
- vpn (5)
- Pi (5)
- gitea (5)
- git (5)
- Windows 2012 (4)
- Ubuntu 22.04 (4)
- opnsense (4)
- openpgp.js (4)
- mysql (4)
- docker (4)
- Xubuntu (3)
- Windows 2016 (3)
- web2 (3)
- seo (3)
- LMS (3)
- Japanisch (3)
- ipkg (3)
- bash (3)
- app (3)
- Android (3)
- Zertifizierungsstelle (2)
- www (2)
- wsus (2)
- Windows Updates (2)
- windows 2022 (2)
- Windows 2008 (2)
- wadoku (2)
- VMware (2)
- verschlüsselung (2)
- Scripts (2)
- php (2)
- pgp (2)
- perl (2)
- openvpn (2)
- Kanji (2)
- javascript (2)
- GnuPgP (2)
Nichts gefunden
Es wurde zur Story Wadoku und die Reise wie man ein XML verarbeitet kein Kommentar gefundenInformation
Werbung oder Ähnliches sind nicht erlaubt, daher wird jeder Beitrag geprüft und freigegeben.Advertising, etc. are not allowed, so any contribution is reviewed and approved.
Facebook-Webadress are not allowed, Facebook als Webadresse ist nicht erlaubt
* Die E-Mail wird nicht veröffentlicht / The email will not be published
** Bitte Zahl eintragen / Please enter the number
Modal Header
Some text in the Modal Body
Some other text...
(c)2025 stastka.ch // help system