Windows 10 Insider Preview Build 18875 (20H1)
A Log Horizon második évadának 9. epizódjában, amikor ...
Shiroe meghalt, és megjelent az Elder Tale nem hivatalos 14. szerverén, a teszt szerveren, amely a Hold helyett a Földön volt,
... ellenőrizte a helyet, és a párbeszédpanel többnyire el volt zavarodva, elmentve a hely nevéhez Kanca Tranquillitatis.
Feloldható-e az elrontott szöveg, vagy egyszerűen szemét?
Igen, az elrontott szöveg a mojibake eredménye, ahol az eredeti japán szöveget Shift-JIS kódolással kódolják a Windows-1256 kódolással.
Ha valaha megnyit egy japán weboldalt vagy szöveges fájlt, amelyet Shift-JIS kódolással (2 bájtos karakterkészlet) kódolnak, néhány nyugati kódolással a Windows rendszerben (1 bájtos karakterkészlet), akkor a ��
párosul valamilyen más karakterrel az eredményül kapott nézetben. Mivel megfigyelem, hogy a képen vannak arab karakterek, a meglévő szöveges fájlom egyikét használtam, amelyet a Shift-JIS kódol, és megpróbáltam arab (Windows) kódolással megnyitni a böngészőben, és rájöttem, hogy arab (Windows) vagy a nyugati kódolásnak ugyanaz a leképezése ��
és ��
(ami a kócos szöveg másik gyakori karaktere).
Miután összehasonlítottam a megfelelően renderelt helyállapot-ablakkal és némi tippeléssel, sikerült az elrontott szöveget megfelelő japán szöveggé dekódolni (az érthetőség kedvéért a zárójeleket hozzáadom, és nem az elrontott szövegektől dekódolom):
������������������ ��������������� ��������������� ��������������� ������������ ���������������/��������������������������� ��������������� ������������������������ ������������������������ ���������������/������������ ���������������/������������
Fordítás:
Moon Server Moon Server Isolated zone/No monster PVP allowed Special skills allowed Entry restriction/Restricted Exit restriction/Restricted
Függelék
Az eredmény összehasonlításához ellenőrizze a következő Python 3 kóddarabot:
garbled = '��T��[��o��[\n������T��[��o��[\n��]��[�����\n������T��[��o��[\n����������\n�����������]��[�����/������������X��^��[��o��������������\n���������������\n�����������s������������\\���������\n��@���S��������Z��g���p��������\\\n��@��i����������������/�����������\xa0�����\n��@�������o�����������/�����������\xa0�����' print(garbled.encode('Windows-1256').decode('Shift-JIS'))
Az alábbiakban a csak megtekintésre forrás1 a mojibake képeivel való összehasonlításhoz:
1 Az alábbi szöveg U + 200E balról jobbra jelölést tartalmaz, hogy megakadályozza az arab karaktereket abban, hogy jobbról balra jelenjenek meg, és alakjukat a helyzetük alapján megváltoztassák. Egy másik probléma, amely megakadályozza az egyenes másolást, az U + 00A0 No-Break Space jelenlétének köszönhető, amely böngészőből másolva térré alakul.
�����T��������[��������o��������[��� ���������������T��������[��������o��������[��� �����]��������[�������������� ���������������T��������[��������o��������[��� ���������������������� ��������������������������]��������[��������������/������������������������������X��������^��������[��������o����������������������������������� ��������������������������������� ��������������������������s������������������������������\������������������������ �����@���������S��������������������Z��������g���������p��������������������\��� �����@��������i�������������������������������������/��������������������������������������������� �����@�������������������o��������������������������/���������������������������������������������
1 - "PvP megengedett": Huh. Kíváncsi, vajon ez végül fontos lesz-e?