大数据系列修炼-Scala课程01

简介

由于本人刚毕业,也是从事软件开发相关的工作。想再学习一下关于大数据、移动互联网、云计算相关的技术。为我的未来打好基础、并且从零开始学习大数据相关的知识,脚踏实地的走好每一步,听行业前辈说毕业生刚工作的三年是非常关键的,所有我每天抽出一点时间学习大数据相关知识, 也算是给我我未来买一份保险吧!也有从事大数据相关的工作的打算,也是未来规划的一部分吧!少年!

关于Scala介绍

Scala首先是一门编程语言,并且非常纯粹的面向对象编程语言,语法也非常简洁,相对java。Scala结合的"命令式"和"函数式"编程的风格!期待了解Scala相关知识,与c、c++、java、C#有什么不同呢?就让我快速加入学习中探究吧!

Scala起步课程

首先,学习这一系列课程大致按照王家林老师的DT大数据梦工厂(微信公众账号:DT_Spark)的视频。希望大家关注并一起学习。今天我会从最基础的开始学起,并在blog后分享相关视频,会发布最新的和我学习课程的心得。希望大家多多指教!

1)Scala开发环境搭建和HelloWorld解析

环境搭建主要包括jdk、Scala环境变量的添加,jdk安装以及环境配置就不用多说了,网上收一下贼多了啊!Scala安装配置也不是很难,跟jdk差不多,下载,安装,配置就欧了,下载地址(http://www.scala-lang.org/download/all.html),环境配置就添加SCALA_HOME变量和在path中添加路径就行了,回到命令窗口测试一下就行了。

这些都安装好了,就还差集成开发环境了,Windows中推荐用IntelliJ IDEA ,对于我呢,在学校玩过一点关于spark的知识的基础也有一点了解,对于初学者我也现在eclipse开发了,Scala官网有相关的集成工作,下载安装就可用了,非常方便。地址(http://scala-ide.org/index.html)

前面都成功了,下面就进行it界最经典的例子,HelloWorld的实现,这个也不知道是谁最先使用的,每种语言对它是情有独钟啦!从这个就能大体知道这门语言的独特之处了。前面都说了Scala是函数式编程,实现这个例子非常简单,def定义一个函数就ok了。比java简洁很多了,unit标示符表示返回结果,输出就用println就行了。

/**
* @author Administrator
*/
object HelloScala {
def main(args: Array[String]): Unit = {
println("Hello Scala!!")
}
}
2)Scala函数定义、流程控制、异常处理入门实战

函数定义只需加一个def就行了后面添加函数名和参数,参数形式(参数名1:类型,参数名2:类型,.....)再加一个返回值就行。

流程控制就if else的编写,与java没有什么区别

异常处理try捕获异常catch抛出异常用Case匹配,最后finally。

package com.dt.zhangsh.scala
/**
* @author Administrator
*/
object HelloScala { def main(args: Array[String]): Unit = {
//main里面都行
//firstMenth("This is ", 21) // for(arg <- args) println(arg)
//
// var file = "scala.txt"
// //判断语句
// if (!args.isEmpty) file = args(0)
}
//Scala函数定义
def firstMenth(para1:String,para2:Int){
println(para1+":"+para2)
}
//可以在object中访问
// firstMenth("This is ", 21)
//流程控制
// def doWhile(){
// var line = ""
// do {
// line = readLine()
// println("Read: " + line)
// } while (line != "")
// }
//
//异常处理
val n = 99
try {
val half = if (n % 2 == 0) n /2 else throw
new RuntimeException("N must be event")
// Use the file
}catch {
case e : Exception => println("The exception is :" + e.getMessage())
}finally{
}
}
3)Tuple、Array、Map与文件操作入门实战

Tuple有点像key-value,简洁定义

Array简洁,有点像js与java的结合

Map键值对,key->value

文件操作就从source中fromfile方法获取文件,接着对文件进行操作。

import scala.collection.mutable.ArrayBuffer

/**
* @author Administrator
*/
object Tuple_Array_MapOps {
def main(args: Array[String]): Unit = {
//Tuple操作
def tupleOp()
{
val tuples=("spark","Hadoop","scala")
println(tuples._1)
println(tuples._2)
println(tuples._3)
}
// tupleOp() //Array操作
def ArrayOp()
{
val s = Array("Hello", "World")
for (i <- 0 until s.length)
println(i + ": " + s(i))
}
// ArrayOp()
}
//Map操作
def MapOp()
{
val mappara = Map("book"->10,"gun"->18,"ipad"->1000)
for((k,v) <- mappara) println("key is :"+k+",value is "+v)
}
MapOp()
}
4)For与Function进阶实战、Lazy的使用

For循环 把数组(para1 to para2)遍历后给变量para3,写法for(para3 <- para1 to para2,para4 <-para5 to para6 if para3!para4)标红的是首要条件

Function函数 def定义函数,并且函数都使用返回值,可以匿名函数,但是要在主要迭代函数不能使用没有返回值哦

lazy的使用  lazy修饰变量就延迟加载,第一次加载的时候加载!

import scala.io.Source

/**
* @author Administrator
*/
object For_Function_LazyOps {
def main(args: Array[String]): Unit = {
//for操作
def forOp()
{
//格式 for(para1 <- para2 to para3;para4 <- para5 to para6) para2 to para3与para5 to para6看做数组,遍历后把值给前面的参数
for(i <- 1 to 2; j <- 1 to 2) println((100*i + j) + " ")
//后面可以跟首要条件 if加表达式
// for(i <- 1 to 2; j <- 1 to 2 if i != j) print((100*i + j) + " ")
}
// forOp() //Fuction 定义
def FunctionOp()
{
//定义函数
def addA(x : Int) = x +100
//匿名定义函数
val add = (x : Int) => x +200
println("The result from a function is : " + addA(2))
println("The result from a val is : " + add(2))
//迭代函数必须有返回类型
def fac(n:Int):Int = if (n <= 0) 1 else n * fac(n - 1)
println("The result from a fac is : " + fac(10))
}
// FunctionOp() //Lazy操作
def LazyOp()
{
lazy val file = Source.fromFile("D:\\test.txt")
// println("Scala")
for (line <- file.getLines) println(line)
}
LazyOp()
}
}

今天就聊到这儿!

百度网盘地址:http://pan.baidu.com/s/1hqAh8US

上一篇:从构建分布式秒杀系统聊聊Disruptor高性能队列


下一篇:bzoj千题计划150:bzoj2738: 矩阵乘法