Як розібрати JSON у Scala, використовуючи стандартні класи Scala?


113

Я використовую збірку в класі JSON в Scala 2.8 для розбору коду JSON. Я не хочу використовувати Liftweb той чи інший через мінімізацію залежностей.

Те, що я роблю, здається занадто необхідним, чи є кращий спосіб це зробити?

import scala.util.parsing.json._
...
val json:Option[Any] = JSON.parseFull(jsonString)
val map:Map[String,Any] = json.get.asInstanceOf[Map[String, Any]]
val languages:List[Any] = map.get("languages").get.asInstanceOf[List[Any]]
languages.foreach( langMap => {
val language:Map[String,Any] = langMap.asInstanceOf[Map[String,Any]]
val name:String = language.get("name").get.asInstanceOf[String]
val isActive:Boolean = language.get("is_active").get.asInstanceOf[Boolean]
val completeness:Double = language.get("completeness").get.asInstanceOf[Double]
}

Відповіді:


129

Це рішення, засноване на витяжках, які виконуватимуть клас:

class CC[T] { def unapply(a:Any):Option[T] = Some(a.asInstanceOf[T]) }

object M extends CC[Map[String, Any]]
object L extends CC[List[Any]]
object S extends CC[String]
object D extends CC[Double]
object B extends CC[Boolean]

val jsonString =
    """
      {
        "languages": [{
            "name": "English",
            "is_active": true,
            "completeness": 2.5
        }, {
            "name": "Latin",
            "is_active": false,
            "completeness": 0.9
        }]
      }
    """.stripMargin

val result = for {
    Some(M(map)) <- List(JSON.parseFull(jsonString))
    L(languages) = map("languages")
    M(language) <- languages
    S(name) = language("name")
    B(active) = language("is_active")
    D(completeness) = language("completeness")
} yield {
    (name, active, completeness)
}

assert( result == List(("English",true,2.5), ("Latin",false,0.9)))

На початку циклу for for я штучно загортаю результат у список, щоб в кінці вийшов список. Тоді в решті циклу for я використовую той факт, що генератори (з використанням <-) та значення значення (використовуючи =) використовуватимуть методи непристосування.

(Старіша відповідь відредагована - перевірити історію редагування, якщо вам цікаво)


Вибачте, щоб викопати стару публікацію, але який сенс для першого Some (M (карта)) у циклі? Я розумію, що M (map) дістає карту до змінної "map", але що робити з Some?
Федеріко Бонеллі

1
@FedericoBonelli, JSON.parseFullповертається Option[Any], тому він починається з List(None)або List(Some(any)). Це Someдля узгодження шаблону на Option.
huynhjl

21

Ось так я співпадаю з шаблоном:

val result = JSON.parseFull(jsonStr)
result match {
  // Matches if jsonStr is valid JSON and represents a Map of Strings to Any
  case Some(map: Map[String, Any]) => println(map)
  case None => println("Parsing failed")
  case other => println("Unknown data structure: " + other)
}

чи можете ви навести приклад свого jsonStr, він не працює з наведеним вище прикладом jsonStr
priya khokher

Можливо, варто поставити власне запитання щодо вашої проблеми. Наразі Scala не встановлена ​​на моїй машині, тому я не маю готових рядків JSON.
Маттіас Браун

12

Мені подобається відповідь @ huynhjl, це вело мене по правильному шляху. Однак це не чудово в обробці помилок. Якщо потрібний вузол не існує, ви отримуєте винятковий формат. Я трохи адаптував це, щоб скористатися, Optionщоб краще впоратися з цим.

class CC[T] {
  def unapply(a:Option[Any]):Option[T] = if (a.isEmpty) {
    None
  } else {
    Some(a.get.asInstanceOf[T])
  }
}

object M extends CC[Map[String, Any]]
object L extends CC[List[Any]]
object S extends CC[String]
object D extends CC[Double]
object B extends CC[Boolean]

for {
  M(map) <- List(JSON.parseFull(jsonString))
  L(languages) = map.get("languages")
  language <- languages
  M(lang) = Some(language)
  S(name) = lang.get("name")
  B(active) = lang.get("is_active")
  D(completeness) = lang.get("completeness")
} yield {
  (name, active, completeness)
}

Звичайно, це не обробляє помилки настільки, як уникати їх. Це дасть порожній список, якщо будь-який із вузлів json відсутній. Ви можете використовувати a, matchщоб перевірити наявність вузла, перш ніж діяти ...

for {
  M(map) <- Some(JSON.parseFull(jsonString))
} yield {
  map.get("languages") match {
    case L(languages) => {
      for {
        language <- languages
        M(lang) = Some(language)
        S(name) = lang.get("name")
        B(active) = lang.get("is_active")
        D(completeness) = lang.get("completeness")
      } yield {
        (name, active, completeness)
      }        
    }
    case None => "bad json"
  }
}

3
Я думаю, що недоцільність КС можна значно спростити def unapply(a: Option[Any]): Option[T] = a.map(_.asInstanceOf[T]).
Сума

Мабуть, Scala 2.12 потрібна ';' перед рядками з '=' у для розуміння.
akauppi

Для мене найвищий код не "давав порожній список, якщо будь-який з вузлів json відсутній", але дав MatchErrorзамість цього (Scala 2.12). Потрібно обгорнути це для блоку спробу / лову для цього. Будь-які приємні ідеї?
akauppi

7

Я спробував кілька речей, віддавши перевагу збігу шаблонів як спосіб уникнути кастингу, але зіткнувся з проблемою стирання типів на типи колекцій.

Основна проблема полягає в тому, що повний тип результату розбору відображає структуру даних JSON і є або громіздким, або неможливим у повному обсязі. Я думаю, саме тому Any використовується для обрізання визначень типів. Використання будь-якого призводить до необхідності проведення кастингу.

Я зламав щось нижче, що є стислим, але надзвичайно специфічним для даних JSON, що містяться в коді у питанні. Щось більш загальне було б задовільніше, але я не впевнений, чи було б це дуже елегантно.

implicit def any2string(a: Any)  = a.toString
implicit def any2boolean(a: Any) = a.asInstanceOf[Boolean]
implicit def any2double(a: Any)  = a.asInstanceOf[Double]

case class Language(name: String, isActive: Boolean, completeness: Double)

val languages = JSON.parseFull(jstr) match {
  case Some(x) => {
    val m = x.asInstanceOf[Map[String, List[Map[String, Any]]]]

    m("languages") map {l => Language(l("name"), l("isActive"), l("completeness"))}
  }
  case None => Nil
}

languages foreach {println}

Мені подобається користувач неявних, щоб його витягти.
Філ

4
val jsonString =
  """
    |{
    | "languages": [{
    |     "name": "English",
    |     "is_active": true,
    |     "completeness": 2.5
    | }, {
    |     "name": "Latin",
    |     "is_active": false,
    |     "completeness": 0.9
    | }]
    |}
  """.stripMargin

val result = JSON.parseFull(jsonString).map {
  case json: Map[String, List[Map[String, Any]]] =>
    json("languages").map(l => (l("name"), l("is_active"), l("completeness")))
}.get

println(result)

assert( result == List(("English", true, 2.5), ("Latin", false, 0.9)) )

3
Це застаріле в останньому масштабі, Нерозділене. Будь-яка ідея, як ним тоді користуватися?
Sanket_patil

4

Ви можете зробити так! Дуже легко проаналізувати код JSON: P

package org.sqkb.service.common.bean

import java.text.SimpleDateFormat

import org.json4s
import org.json4s.JValue
import org.json4s.jackson.JsonMethods._
//import org.sqkb.service.common.kit.{IsvCode}

import scala.util.Try

/**
  *
  */
case class Order(log: String) {

  implicit lazy val formats = org.json4s.DefaultFormats

  lazy val json: json4s.JValue = parse(log)

  lazy val create_time: String = (json \ "create_time").extractOrElse("1970-01-01 00:00:00")
  lazy val site_id: String = (json \ "site_id").extractOrElse("")
  lazy val alipay_total_price: Double = (json \ "alipay_total_price").extractOpt[String].filter(_.nonEmpty).getOrElse("0").toDouble
  lazy val gmv: Double = alipay_total_price
  lazy val pub_share_pre_fee: Double = (json \ "pub_share_pre_fee").extractOpt[String].filter(_.nonEmpty).getOrElse("0").toDouble
  lazy val profit: Double = pub_share_pre_fee

  lazy val trade_id: String = (json \ "trade_id").extractOrElse("")
  lazy val unid: Long = Try((json \ "unid").extractOpt[String].filter(_.nonEmpty).get.toLong).getOrElse(0L)
  lazy val cate_id1: Int = (json \ "cate_id").extractOrElse(0)
  lazy val cate_id2: Int = (json \ "subcate_id").extractOrElse(0)
  lazy val cate_id3: Int = (json \ "cate_id3").extractOrElse(0)
  lazy val cate_id4: Int = (json \ "cate_id4").extractOrElse(0)
  lazy val coupon_id: Long = (json \ "coupon_id").extractOrElse(0)

  lazy val platform: Option[String] = Order.siteMap.get(site_id)


  def time_fmt(fmt: String = "yyyy-MM-dd HH:mm:ss"): String = {
    val dateFormat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss")
    val date = dateFormat.parse(this.create_time)
    new SimpleDateFormat(fmt).format(date)
  }

}

2

Ось так я роблю бібліотеку Scab Parser Combinator:

import scala.util.parsing.combinator._
class ImprovedJsonParser extends JavaTokenParsers {

  def obj: Parser[Map[String, Any]] =
    "{" ~> repsep(member, ",") <~ "}" ^^ (Map() ++ _)

  def array: Parser[List[Any]] =
    "[" ~> repsep(value, ",") <~ "]"

  def member: Parser[(String, Any)] =
    stringLiteral ~ ":" ~ value ^^ { case name ~ ":" ~ value => (name, value) }

  def value: Parser[Any] = (
    obj
      | array
      | stringLiteral
      | floatingPointNumber ^^ (_.toDouble)
      |"true"
      |"false"
    )

}
object ImprovedJsonParserTest extends ImprovedJsonParser {
  def main(args: Array[String]) {
    val jsonString =
    """
      {
        "languages": [{
            "name": "English",
            "is_active": true,
            "completeness": 2.5
        }, {
            "name": "Latin",
            "is_active": false,
            "completeness": 0.9
        }]
      }
    """.stripMargin


    val result = parseAll(value, jsonString)
    println(result)

  }
}
Використовуючи наш веб-сайт, ви визнаєте, що прочитали та зрозуміли наші Політику щодо файлів cookie та Політику конфіденційності.
Licensed under cc by-sa 3.0 with attribution required.