Anonim

Windows 10 Insider Preview Build 18875 (20H1)

A Log Horizon második évadának 9. epizódjában, amikor ...

Shiroe meghalt, és megjelent az Elder Tale nem hivatalos 14. szerverén, a teszt szerveren, amely a Hold helyett a Földön volt,

... ellenőrizte a helyet, és a párbeszédpanel többnyire el volt zavarodva, elmentve a hely nevéhez Kanca Tranquillitatis.

Feloldható-e az elrontott szöveg, vagy egyszerűen szemét?

Igen, az elrontott szöveg a mojibake eredménye, ahol az eredeti japán szöveget Shift-JIS kódolással kódolják a Windows-1256 kódolással.

Ha valaha megnyit egy japán weboldalt vagy szöveges fájlt, amelyet Shift-JIS kódolással (2 bájtos karakterkészlet) kódolnak, néhány nyugati kódolással a Windows rendszerben (1 bájtos karakterkészlet), akkor a �� párosul valamilyen más karakterrel az eredményül kapott nézetben. Mivel megfigyelem, hogy a képen vannak arab karakterek, a meglévő szöveges fájlom egyikét használtam, amelyet a Shift-JIS kódol, és megpróbáltam arab (Windows) kódolással megnyitni a böngészőben, és rájöttem, hogy arab (Windows) vagy a nyugati kódolásnak ugyanaz a leképezése �� és �� (ami a kócos szöveg másik gyakori karaktere).

Miután összehasonlítottam a megfelelően renderelt helyállapot-ablakkal és némi tippeléssel, sikerült az elrontott szöveget megfelelő japán szöveggé dekódolni (az érthetőség kedvéért a zárójeleket hozzáadom, és nem az elrontott szövegektől dekódolom):

������������������ ��������������� ��������������� ��������������� ������������ ���������������/��������������������������� ��������������� ������������������������ ������������������������ ���������������/������������ ���������������/������������ 

Fordítás:

 Moon Server  Moon Server  Isolated zone/No monster  PVP allowed Special skills allowed Entry restriction/Restricted Exit restriction/Restricted 

Függelék

Az eredmény összehasonlításához ellenőrizze a következő Python 3 kóddarabot:

garbled = '��T��[��o��[\n������T��[��o��[\n��]��[�����\n������T��[��o��[\n����������\n�����������]��[�����/������������X��^��[��o��������������\n���������������\n�����������s������������\\���������\n��@���S��������Z��g���p��������\\\n��@��i����������������/�����������\xa0�����\n��@�������o�����������/�����������\xa0�����' print(garbled.encode('Windows-1256').decode('Shift-JIS')) 

Az alábbiakban a csak megtekintésre forrás1 a mojibake képeivel való összehasonlításhoz:

1 Az alábbi szöveg U + 200E balról jobbra jelölést tartalmaz, hogy megakadályozza az arab karaktereket abban, hogy jobbról balra jelenjenek meg, és alakjukat a helyzetük alapján megváltoztassák. Egy másik probléma, amely megakadályozza az egyenes másolást, az U + 00A0 No-Break Space jelenlétének köszönhető, amely böngészőből másolva térré alakul.

�����T��������[��������o��������[��� ���������������T��������[��������o��������[��� �����]��������[�������������� ���������������T��������[��������o��������[��� ���������������������� ��������������������������]��������[��������������/������������������������������X��������^��������[��������o����������������������������������� ��������������������������������� ��������������������������s������������������������������\������������������������ �����@���������S��������������������Z��������g���������p��������������������\��� �����@��������i�������������������������������������/��������������������������������������������� �����@�������������������o��������������������������/��������������������������������������������� 
1
  • "PvP megengedett": Huh. Kíváncsi, vajon ez végül fontos lesz-e?