JavaScript引用类型数据

引用数据类型的变量,是说在内存中保存的值是另外一个内存单位的地址的变量。当使用这个变量的时候,实际上会使用它所保存的地址所对应的值。javascript中除了基本数据类型以外,所有的复杂结构数据都是由object类型衍生而来,无论是数组,还是函数,都属于引用数据类型,在ES6中,引入了class,而class也是object而来,因此引用数据类型的本质没有改变。

赋值和引用传递

在几乎所有的编程语言中都使用等号=进行赋值,当然,也有使用冒号:进行赋值的,但是赋值操作是编程世界里面最常见的操作之一。给变量赋值有两种情况,一种是为变量开辟内存空间,将变量的内容保存到该空间。例如:

var a = 1;
var b = "my string";

还有一种情况,是为变量开辟内存空间后,将内容写到另外一块复杂的内存空间,将这块内存空间的地址指针保存到变量的内存空间。例如:

var obj = {
    name : "Tom",
    age : 10,
    body : {
        head : 1,
        hand : 2,
        foot : 2
    }
};
var fun = function(param) {
    alert(param);
};

而后一种就是引用数据类型。我们通过画内存示意图来表达一个引用数据类型的内存情况:

javascript-object-memory

堆和栈

变量默认情况下会保存在栈内存中,当变量的值为基本数据类型时,程序能较快的读取到栈内存中保存的值。而堆内存中的内容则需要通过栈内存中变量名对应的地址去找,因此性能上慢了很多。也正是因为这个原因,在性能优化时,选择将一个堆内存中保存的数据直接引用给一个变量暂时放在栈内存中,例如:

var foot = object.body.foot;

当第二次使用foot时,就不必在堆内存中找来找去,节省了很多时间。

undefined和null

首先来解释null。当一个引用数据类型被声明时,并没有立即为它开辟内存空间,例如:

var obj = new Object();

当没有为它开辟(堆)内存空间时,它的值为null,也就是没有保存任何内存地址信息。当这个变量在程序进程中一直保持为null时,说明它并没有被赋值,所以理论上会被垃圾回收机制回收内存。

接下来是undefined。和引用数据类型对应,它是一个变量没有被定义时的值,没有被定义的意思是它的数据类型也不确定。由于Javascript中声明一个变量并没有使用int, string, char这种关键字进行声明,所以实际上在声明一个变量时,它默认是没有数据类型的,当初始化它的值时,它也同时拥有了数据类型,用一个代码来说明:

var a;
alert(typeof a); // undefined

上面代码中a被声明,却没有确定数据类型,在内存中的表现就是开辟了内存空间,但还没有赋予具体的内容。但是,在堆内存中,这个声明并不存在,我们无法使用var b在堆内存中声明一个新的变量,为它开辟一个新的空间,所以,下面的情况会略有不同:

var a;
alert(typeof a);
alert(typeof b);
var c = {};
alert(typeof c.d);
alert(typeof e.f); // error

a和b本质不同,a的值是undefined,而b并未经声明,非严格模式下被认为是window.b,所以会报undefined,和下面的c.d一样,但是当使用"use strict"声明为严格模式时,未经声明的b是会报错的。c.d和e.f也不同,因为c是存在的,而c.d并未声明,所以返回undefined,而e并未经声明,所以严格模式下本身就是会报错,即便没有声明严格模式,e的值为undefined,也不能使用e.f,因为e不是一个引用数据类型。如果在这之前声明var e = null,则报错内容不一样,报错会提示不能获取null.f。这个地方还有一点可以探讨,就是c.d在使用之前并没有执行var c.d来声明c.d,毕竟d也是一个变量,但正是因为d是保存在堆内存中(如果存在的话),所以并不能声明,如果非要声明的话,只能用c.d = null这种形式,即对它进行赋值。

从上面这个说法,你可以发现,如果在声明一个引用数据类型时,可以使用var a = null。同时,undefined和null都可以表示声明而不开辟内存空间。

万能的引用:改变堆内存保存的值

引用数据类型,不单单是为了解决复杂的变量(上下文)数据结构存储,引用传递可以帮助我们完成很多复杂的数据操作。本文特别要介绍的,是跨作用域改变堆内存中的值。为了形象的了解这个情况,你可以先阅读一下《javascript中参数的内存引用关系及解决方案》这篇文章中我给出的一种情况。

简单的说,引用传递的过程就是这样:

var object = {
    name : "tom",
    age : 10,
    body : {
        head : 1,
        hand : 2,
        foot : 2
    }
};
// =========================
var a = object,
    b = a,
    c = b,
    d = b;
c._origin = object;
// ==========================
c._origin.age ++;
alert(a.age); // 11
// --------
d.body = {
    eye : 2,
    nose : 1
};
alert(a.body.head); // undefined
alert(a.body.eye); // 2

这里面我们就利用到了引用传递的特性。首先,在var a,b,c,d这块,其实所有的变量都保存了和object一样的内容,也就是object所对应的对象堆内存的地址信息,所以实际上object,a,b,c,d全部都是地址信息,他们的值是一样的。接下来,我们执行了一个c._origin.age ++操作,看上去是对c进行操作,而实际上,跟c一点关系都没有,c的内容仅仅是一个地址信息,真正被操作的,是这个地址信息对应的堆内存中保存的对象的.age属性。不过这里有一个._origin属性有点迷惑性,但是你要知道,c._origin实际上也只是一个地址信息,和a,b,c,d的内容也是一样的。

所以,从上面的解释我们可以看出:如果某个堆内存单元的内容发生了变化,保存该堆内存单元地址信息的所有变量所引用的值也相应发生变化,无论这个变量是保存于栈内存还是堆内存。

接下来,我们用上面的.body被改变来解释。原本object.body其实也是一个地址信息,它指向了堆内存中的另外一个存储单元,但是当我们执行d.body = {}操作时,body保存的信息发生了变化,它保存的内容不再是原来的内存地址信息,而是我们新创建的一个对象的堆内存地址信息,这其实也是一个赋值过程。那么原始的object.body所指向的堆内存信息去哪里了呢?假如程序中没有另外一个变量指向这个内存单元,那么它过段时间会被垃圾回收。

这看上去好像没有什么大不了的,不过如果我告诉你,引用传递在函数参数中仍然有效,那就不一样了,因为我们可以随时在函数的作用域内,改变一个来自外部的对象就很方便了。

2016-07-15

已有2条评论
  1. 一只猫 2016-07-23 18:37

    没什么=w=,就是想说句
    谢谢~
    不需要回复= = 。。

  2. […] 这是非常容易理解的,如果你不是很理解,可以阅读我写的《JavaScript引用类型数据》一文。 […]