前面我们提过:FunDA就像一个管道(PipeLine)。管道内流动着一串数据(Data)或者运算指令(Action)。管道的源头就是能产生纯数据的数据源(Source),跟着在管道的中间会有一些节点(WorkNode),我们可以在这些节点施用(apply)用户提供的功能函数(Task)。用户功能函数可以截取并使用管道中流动的数据或者指令,然后利用一种水龙头开关机制(Valve)来影响流动元素:可以截住、直接传送、传送修改版本、插入新数据。作为FunDA的用户,需要掌握用户功能函数编写模式。我们先从一个简单的用户函数开始介绍:
//定义一个用户作业函数:列印数据,完全不影响数据流 
  def printAlbums: FDATask[FDAROW] = row => { 
    row match { 
      case album: Album => 
        println("____________________") 
        println(s"品名:${album.title}") 
        println(s"演唱:${album.artist}") 
        println(s"年份:${album.year}") 
        println(s"发行:${album.publisher}") 
//原封不动直接传下去 
        fda_next(album) 
      case r@ _ => fda_next(r) 
    } 
  }
上面这个用户函数的类型是FDATask[FDAROW],这是一个函数类型:
    //作业类型 
    type FDATask[ROW] = ROW => Option[List[ROW]]
所以我们用lambda来代表函数内容:row => {函数功能}。lambda为用户函数提供了当前元素。我们用下面方式调用这个用户函数:
  val streamLoader = FDAStreamLoader(slick.driver.H2Driver, toTypedRow _) 
  val albumStream = streamLoader.fda_typedStream(albumsInfo.result)(db)(10.minutes, 512, 128)()() 
//定义一个用户作业函数:列印数据,完全不影响数据流 
  def printAlbums: FDATask[FDAROW] = row => { 
    row match { 
      case album: Album => 
        println("____________________") 
        println(s"品名:${album.title}") 
        println(s"演唱:${album.artist}") 
        println(s"年份:${album.year}") 
        println(s"发行:${album.publisher}") 
//原封不动直接传下去 
        fda_next(album) 
      case r@ _ => fda_next(r) 
    } 
  } 
 
 albumStream.appendTask(printAlbums).startRun
我们把用户函数printAlbums传入appendTask来对数据流进行施用。我们可以在appendTask后面再接一个用户函数,这个用户函数截取到的数据流元素是原装的数据源,因为在任何情况下printAlbums都会原封不动地把截获的元素用fda_next()传下去。运行一下下面这个就清楚了:
 albumStream.appendTask(printAlbums).appendTask(printAlbums).startRun
相反情况我们只需要做下面的修改把fda_next替换成fda_skip就可以证实了:
//原封不动直接传下去 
        fda_skip 
//        fda_next(album)
我们也可以根据当前元素情况生成一条FDAActionROW,它的定义是这样的:
  type FDAAction = DBIO[Int] 
 
  case class FDAActionRow(action: FDAAction) extends FDAROW 
  def fda_mkActionRow(action: FDAAction): FDAActionRow = FDAActionRow(action) 
 
  class FDAActionRunner(slickProfile: JdbcProfile) { 
 
    import slickProfile.api._ 
 
    def fda_execAction(action: FDAAction)(slickDB: Database): Int = 
      Await.result(slickDB.run(action), Duration.Inf) 
  } 
  object FDAActionRunner { 
    def apply(slickProfile: JdbcProfile): FDAActionRunner = new FDAActionRunner(slickProfile) 
  }
我们可以把一条FDAActionRow传下去:
  def updateYear: FDATask[FDAROW] = row => { 
      row match { 
        case album: Album => { 
          val updateAction = albums.filter(r => r.title === album.title) 
          .map(_.year) 
          .update(Some(2017)) 
          fda_next(FDAActionRow(updateAction)) 
        } 
        case others@ _ => fda_next(others) 
      } 
  }
我们也可以把原数据同时传下去:
  def updateYear: FDATask[FDAROW] = row => { 
      row match { 
        case album: Album => { 
          val updateAction = albums.filter(r => r.title === album.title) 
          .map(_.year) 
          .update(Some(2017)) 
          fda_next(FDAActionRow(updateAction)) 
          fda_next(album) 
        } 
        case others@ _ => fda_next(others) 
      } 
  }
我们需要FDAActionRunner来运算action:
val runner = FDAActionRunner(slick.driver.H2Driver) 
  def runActions: FDATask[FDAROW] = row => { 
    row match { 
      case FDAActionRow(action) => 
        runner.fda_execAction(action)(db) 
        fda_skip 
      case others@ _ => fda_next(others) 
    } 
  }
现在试试运转这个管道:
  albumStream.appendTask(updateYear).appendTask(runActions).appendTask(printAlbums).startRun
实际上updateYear和runActions可以一步完成。但细化拆分功能就是函数式编程的一个特点,因为能够更自由的进行组合,这其中就包括了并行运算组合。
下面是这篇讨论的示范源代码:
package com.bayakala.funda.fdasources.examples 
import slick.driver.H2Driver.api._ 
import com.bayakala.funda.fdasources.FDADataStream._ 
import com.bayakala.funda.samples._ 
import com.bayakala.funda.fdarows._ 
import com.bayakala.funda.fdapipes._ 
import FDAValves._ 
import com.bayakala.funda.fdarows.FDARowTypes._ 
import scala.concurrent.duration._ 
 
object Example2 extends App { 
   val albums = SlickModels.albums 
   val companies = SlickModels.companies 
 
//数据源query 
   val albumsInfo = for { 
     (a,c) <- albums join companies on (_.company === _.id) 
   } yield (a.title,a.artist,a.year,c.name) 
 
//query结果强类型(用户提供) 
  case class Album(title: String, artist: String, year: Int, publisher: String) extends FDAROW 
//转换函数(用户提供) 
  def toTypedRow(row: (String, String, Option[Int], String)): Album = 
    Album(row._1, row._2, row._3.getOrElse(2000), row._4) 
 
  val db = Database.forConfig("h2db") 
 
  val streamLoader = FDAStreamLoader(slick.driver.H2Driver, toTypedRow _) 
  val albumStream = streamLoader.fda_typedStream(albumsInfo.result)(db)(10.minutes, 512, 128)()() 
//定义一个用户作业函数:列印数据,完全不影响数据流 
  def printAlbums: FDATask[FDAROW] = row => { 
    row match { 
      case album: Album => 
        println("____________________") 
        println(s"品名:${album.title}") 
        println(s"演唱:${album.artist}") 
        println(s"年份:${album.year}") 
        println(s"发行:${album.publisher}") 
//原封不动直接传下去 
//        fda_skip 
        fda_next(album) 
      case r@ _ => fda_next(r) 
    } 
  } 
 
// albumStream.appendTask(printAlbums).appendTask(printAlbums).startRun 
 
 
 
  def updateYear: FDATask[FDAROW] = row => { 
      row match { 
        case album: Album => { 
          val updateAction = albums.filter(r => r.title === album.title) 
          .map(_.year) 
          .update(Some(2017)) 
          fda_next(FDAActionRow(updateAction)) 
          fda_next(album) 
        } 
        case others@ _ => fda_next(others) 
      } 
  } 
  val runner = FDAActionRunner(slick.driver.H2Driver) 
  def runActions: FDATask[FDAROW] = row => { 
    row match { 
      case FDAActionRow(action) => 
        runner.fda_execAction(action)(db) 
        fda_skip 
      case others@ _ => fda_next(others) 
    } 
  } 
 
  albumStream.appendTask(updateYear).appendTask(runActions).appendTask(printAlbums).startRun 
 
}
原创文章,作者:奋斗,如若转载,请注明出处:https://blog.ytso.com/tech/pnotes/12870.html
