Вирішення проблеми з парсингом JSON-поля, яке не зберігається як коректний JSON

4 Березня 2024 в 12:47 268

Під час взаємодії з API можуть виникати різноманітні проблеми, зокрема, коли дані, що повертаються, не відповідають очікуваному формату. Однією з таких проблем є ситуація, коли JSON-об’єкт містить поля типу UUID, але вони не зберігаються як рядки, як це передбачено специфікацією, а натомість надходять у некоректно відформатованому вигляді.

Оригінальний формат JSON поля з UUID має виглядати наступним чином:

{
    "fieldName": "11111-22222-33333-44444"
}

{

"fieldName": "11111-22222-33333-44444"

}

Але, наприклад, відповідь від API може містити UUID-поля у вигляді числових значень без лапок, як у прикладі:

{
    "fieldName": 11111-22222-33333-44444
}

{

"fieldName": 11111-22222-33333-44444

}

При спробі парсити такий JSON за допомогою стандартної функції json.loads() з’явиться помилка JSON.Decode(), оскільки це не є коректним JSON. Однак, доступний метод response.text дозволяє отримати текст відповіді, але це не завжди зручно, якщо потрібно працювати з даними у форматі JSON.

Один із способів вирішення цієї проблеми – це конвертація некоректно відформатованих UUID-полів у рядковий формат. Для цього можна використати регулярні вирази або просто додати лапки до значень поля. Наприклад:

{
    "fieldName": "11111-22222-33333-44444"
}

{

"fieldName": "11111-22222-33333-44444"

}

Додавши лапки до значення поля, ми отримаємо коректний JSON, який можна буде успішно спарсити:

{
    "fieldName": "11111-22222-33333-44444"
}

{

"fieldName": "11111-22222-33333-44444"

}

Ще один варіант – це створення власного парсера, який буде обробляти некоректно відформатовані UUID-поля. Цей підхід може бути складнішим, але він дає більшу гнучкість у роботі з даними. Наприклад, парсер може шукати всі числові значення, які відповідають формату UUID, і конвертувати їх у рядковий формат перед подальшим парсингом JSON.