Перетворення UDF-8 закодованих NSData в NSString


567

У мене UTF-8 закодовано NSDataз сервера Windows, і я хочу його перетворити NSStringна iPhone. Оскільки дані містять символи (на зразок символу градуса), які мають різні значення на обох платформах, як я можу перетворити дані у рядки?


16
UTF-8 є повсюдно UTF-8. Як тільки це UTF-8, для різних платформ немає різних значень. У цьому вся суть.
gnasher729

Відповіді:


1155

Якщо дані не скасовуються, слід скористатися -initWithData:encoding:

NSString* newStr = [[NSString alloc] initWithData:theData encoding:NSUTF8StringEncoding];

Якщо дані недійсні, слід замість цього використати, -stringWithUTF8String:щоб уникнути зайвих \0в кінці.

NSString* newStr = [NSString stringWithUTF8String:[theData bytes]];

(Зверніть увагу, що якщо вхід неправильно закодований UTF-8, ви отримаєте nil.)


Швидкий варіант:

let newStr = String(data: data, encoding: .utf8)
// note that `newStr` is a `String?`, not a `String`.

Якщо дані недійсні, ви можете піти безпечним шляхом, як видалити цей нульовий символ, або небезпечним способом, подібним до версії Objective-C, наведеної вище.

// safe way, provided data is \0-terminated
let newStr1 = String(data: data.subdata(in: 0 ..< data.count - 1), encoding: .utf8)
// unsafe way, provided data is \0-terminated
let newStr2 = data.withUnsafeBytes(String.init(utf8String:))

5
Стережись!! якщо ви використовуєте stringWithUTF8String, не передайте йому аргумент NULL або він викине виняток
JasonZ

31
ЗНАЙДЕНО ЦЕ: при використанні "stringWithUTF8String:" для рядка, який не припиняється до нуля, результат непередбачуваний!
Берік

2
Обидва рішення для мене повернули нуль.
Гусин

1
Звідки ви знаєте, ваші NSData припинені чи ні? Див відповідь Тома Харрінгтона по адресою: stackoverflow.com/questions/27935054 / ... . З мого досвіду, ніколи не слід вважати, що NSData або припиняється до нуля, або ні: він може відрізнятися від однієї передачі до іншої, навіть від відомого сервера.
Elise van Looij

1
@ElisevanLooij Дякую за посилання. Я б заперечував, що якщо передані дані можуть бути випадковим чином скасовані, або протокол неправильно визначений.
kennytm

28

Ви можете назвати цей метод

+(id)stringWithUTF8String:(const char *)bytes.

27
Тільки якщо дані недійсні. Якого може не бути (а насправді, мабуть, немає).
Іван Вучиця

я не знаю, чому на Землі це порушиться на ненульові завершені рядки, бачачи, як NSDataзнає, скільки байтів у нього ...
Клавдіу

5
@Claudiu, ти не передаєш об’єкт NSData, ти передаєш його (const char *), отриманий за допомогою [даних байтів], що є лише вказівником, немає інформації про розмір. Отже, блок даних, на який він вказує, повинен бути скасований на нуль. Перегляньте документацію, в ній прямо написано.
jbat100

1
@ jbat100: Звичайно. Мені було не ясно. Я мав на увазі, враховуючи, що можна перейти від ненульового закінчення NSDataдо NSString(див. Відповідь KennyTM), я здивований, що це не +(id)stringWithUTF8Data:(NSData *)dataпросто працює.
Клавдіу

stringWithUTF8Data, тому більшість із нас створюють категорію NSString + Foo і створюють метод.
Вільям Чернюк

19

Я смиренно подаю категорію, щоб зробити це менш дратівливим:

@interface NSData (EasyUTF8)

// Safely decode the bytes into a UTF8 string
- (NSString *)asUTF8String;

@end

і

@implementation NSData (EasyUTF8)

- (NSString *)asUTF8String {
    return [[NSString alloc] initWithData:self encoding:NSUTF8StringEncoding];    
}

@end

(Зверніть увагу, що якщо ви не використовуєте ARC, вам там знадобиться autorelease.)

Тепер замість жахливо багатослівного:

NSData *data = ...
[[NSString alloc] initWithData:data encoding:NSUTF8StringEncoding];

Ви можете зробити:

NSData *data = ...
[data asUTF8String];

18

Версія Swift від рядка до даних та назад до рядка:

Xcode 10.1 • Швидкий 4.2.1

extension Data {
    var string: String? {
        return String(data: self, encoding: .utf8)
    }
}

extension StringProtocol {
    var data: Data {
        return Data(utf8)
    }
}

extension String {
    var base64Decoded: Data? {
        return Data(base64Encoded: self)
    }
}

Ігровий майданчик

let string = "Hello World"                                  // "Hello World"
let stringData = string.data                                // 11 bytes
let base64EncodedString = stringData.base64EncodedString()  // "SGVsbG8gV29ybGQ="
let stringFromData = stringData.string                      // "Hello World"

let base64String = "SGVsbG8gV29ybGQ="
if let data = base64String.base64Decoded {
    print(data)                                    //  11 bytes
    print(data.base64EncodedString())              // "SGVsbG8gV29ybGQ="
    print(data.string ?? "nil")                    // "Hello World"
}

let stringWithAccent = "Olá Mundo"                          // "Olá Mundo"
print(stringWithAccent.count)                               // "9"
let stringWithAccentData = stringWithAccent.data            // "10 bytes" note: an extra byte for the acute accent
let stringWithAccentFromData = stringWithAccentData.string  // "Olá Mundo\n"

16

Іноді методи в інших відповідях не працюють. У моєму випадку я генерую підпис з моїм приватним ключем RSA, і результат - NSData. Я виявив, що це, здається, працює:

Ціль-С

NSData *signature;
NSString *signatureString = [signature base64EncodedStringWithOptions:0];

Швидкий

let signatureString = signature.base64EncodedStringWithOptions(nil)

як отримати цю нитку до nsdata?
Даршан Кунядія

1
@DarshanKunjadiya: Objective-C : [[NSData alloc] initWithBase64EncodedString:signatureString options:0]; Свіфт : NSData(base64EncodedString: str options: nil)
mikeho

1

Просто підводячи підсумок, ось повна відповідь, яка працювала для мене.

Моя проблема полягала в тому, що коли я користувався

[NSString stringWithUTF8String:(char *)data.bytes];

Рядок, який я отримав, був непередбачуваним: близько 70% він містив очікувану величину, але занадто часто це призводило до Nullабо навіть гірше: одягали в кінці рядка.

Після деякого копання я перейшов на

[[NSString alloc] initWithBytes:(char *)data.bytes length:data.length encoding:NSUTF8StringEncoding];

І отримували очікуваний результат щоразу.


Важливо, щоб ви розуміли <i> чому </i> ви отримали "сміття" результати.
Едгар Арутьонійський

1

За допомогою Swift 5 ви можете використовувати ініціалізатор String's init(data:encoding:), щоб перетворити Dataекземпляр в Stringекземпляр за допомогою UTF-8. init(data:encoding:)має таку заяву:

init?(data: Data, encoding: String.Encoding)

Повертає Stringініціалізацію шляхом перетворення заданих даних у символи Unicode за допомогою заданого кодування.

Наступний код майданчика показує, як ним користуватися:

import Foundation

let json = """
{
"firstName" : "John",
"lastName" : "Doe"
}
"""

let data = json.data(using: String.Encoding.utf8)!

let optionalString = String(data: data, encoding: String.Encoding.utf8)
print(String(describing: optionalString))

/*
 prints:
 Optional("{\n\"firstName\" : \"John\",\n\"lastName\" : \"Doe\"\n}")
*/
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.