lizhen's blog

[真] Node多线程

2019-01-31T19:52:19.000Z

本文测试使用环境：
系统：macOS Mojave 10.14.2
CPU：4 核 2.3 GHz
Node: 10.15.1

从 Node 线程说起

一般人理解 Node 是单线程的，所以 Node 启动后线程数应该为 1，我们做实验看一下。

1
2
3

setInterval(() => {
  console.log(new Date().getTime())
}, 3000)

可以看到 Node 进程占用了 7 个线程。为什么会有 7 个线程呢？

我们都知道，Node 中最核心的是 v8 引擎，在 Node 启动后，会创建 v8 的实例，这个实例是多线程的。

主线程：编译、执行代码。
编译/优化线程：在主线程执行的时候，可以优化代码。
分析器线程：记录分析代码运行时间，为 Crankshaft 优化代码执行提供依据。
垃圾回收的几个线程。

所以大家常说的 Node 是单线程的指的是 JavaScript 的执行是单线程的，但 Javascript 的宿主环境，无论是 Node 还是浏览器都是多线程的。

Node 有两个编译器：
full-codegen：简单快速地将 js 编译成简单但是很慢的机械码。
Crankshaft：比较复杂的实时优化编译器，编译高性能的可执行代码。

某些异步 IO 会占用额外的线程

还是上面那个例子，我们在定时器执行的同时，去读一个文件：

const fs = require('fs')

setInterval(() => {
    console.log(new Date().getTime())
}, 3000)

fs.readFile('./index.html', () => {})

线程数量变成了 11 个，这是因为在 Node 中有一些 IO 操作（DNS，FS）和一些 CPU 密集计算（Zlib，Crypto）会启用 Node 的线程池，而线程池默认大小为 4，因为线程数变成了 11。

我们可以手动更改线程池默认大小：

1	process.env.UV_THREADPOOL_SIZE = 64

一行代码轻松把线程变成 71 😊

cluster 是多线程吗？

Node 的单线程也带来了一些问题，比如对 cpu 利用不足，某个未捕获的异常可能会导致整个程序的退出等等。因为 Node 中提供了 cluster 模块，cluster 实现了对 child_process 的封装，通过 fork 方法创建子进程的方式实现了多进程模型。比如我们最常用到的 pm2 就是其中最优秀的代表。

我们看一个 cluster 的 demo：

const cluster = require('cluster');
const http = require('http');
const numCPUs = require('os').cpus().length;

if (cluster.isMaster) {
  console.log(`主进程 ${process.pid} 正在运行`);
  for (let i = 0; i < numCPUs; i++) {
    cluster.fork();
  }

  cluster.on('exit', (worker, code, signal) => {
    console.log(`工作进程 ${worker.process.pid} 已退出`);
  });
} else {  
  // 工作进程可以共享任何 TCP 连接。
  // 在本例子中，共享的是 HTTP 服务器。
  http.createServer((req, res) => {
    res.writeHead(200);
    res.end('Hello World');
  }).listen(8000);
  console.log(`工作进程 ${process.pid} 已启动`);
}

这个时候看下活动监视器：

一共有 9 个进程，其中一个主进程，cpu 个数 * cpu 核数 = 2 * 4 = 8 个子进程。

所以无论 child_process 还是 cluster，都不是多线程模型，而是多进程模型。虽然开发者意识到了单线程模型的问题，但是没有从根本上解决问题，而且提供了一个多进程的方式来模拟多线程。从前面的实验可以看出，虽然 Node （V8）本身是具有多线程的能力的，但是开发者并不能很好的利用这个能力，更多的是由 Node 底层提供的一些方式来使用多线程。Node 官方说：

You can use the built-in Node Worker Pool by developing a C++ addon. On older versions of Node, build your C++ addon using NAN, and on newer versions use N-API. node-webworker-threads offers a JavaScript-only way to access Node’s Worker Pool.

但是对于 JavaScript 开发者，一直没有一个标准的、好用的方式来使用 Node 的多线程能力。

真 - Node 多线程

直到 Node 10.5.0 的发布，官方才给出了一个实验性质的模块 worker_threads 给 Node 提供真正的多线程能力。

先看下简单的 demo：

const {
  isMainThread,
  parentPort,
  workerData,
  threadId,
  MessageChannel,
  MessagePort,
  Worker
} = require('worker_threads');

function mainThread() {
  for (let i = 0; i < 5; i++) {
    const worker = new Worker(__filename, { workerData: i });
    worker.on('exit', code => { console.log(`main: worker stopped with exit code ${code}`); });
    worker.on('message', msg => {
      console.log(`main: receive ${msg}`);
      worker.postMessage(msg + 1);
    });
  }
}

function workerThread() {
  console.log(`worker: workerDate ${workerData}`);
  parentPort.on('message', msg => {
    console.log(`worker: receive ${msg}`);
  }),
  parentPort.postMessage(workerData);
}

if (isMainThread) {
  mainThread();
} else {
  workerThread();
}

上述代码在主线程中开启五个子线程，并且主线程向子线程发送简单的消息。

由于 worker_thread 目前仍然处于实验阶段，所以启动时需要增加 --experimental-worker flag，运行后观察活动监视器：

不多不少，正好多了五个子线程。😊

worker_thread 模块

worker_thread 核心代码

worker_thread 模块中有 4 个对象和 2 个类。

isMainThread: 是否是主线程，源码中是通过 threadId === 0 进行判断的。
MessagePort: 用于线程之间的通信，继承自 EventEmitter。
MessageChannel: 用于创建异步、双向通信的通道实例。
threadId: 线程 ID。
Worker: 用于在主线程中创建子线程。第一个参数为 filename，表示子线程执行的入口。
parentPort: 在 worker 线程里是表示父进程的 MessagePort 类型的对象，在主线程里为 null
workerData: 用于在主进程中向子进程传递数据（data 副本）

来看一个进程通信的例子：

const assert = require('assert');
const {
  Worker,
  MessageChannel,
  MessagePort,
  isMainThread,
  parentPort
} = require('worker_threads');
if (isMainThread) {
  const worker = new Worker(__filename);
  const subChannel = new MessageChannel();
  worker.postMessage({ hereIsYourPort: subChannel.port1 }, [subChannel.port1]);
  subChannel.port2.on('message', (value) => {
    console.log('received:', value);
  });
} else {
  parentPort.once('message', (value) => {
    assert(value.hereIsYourPort instanceof MessagePort);
    value.hereIsYourPort.postMessage('the worker is sending this');
    value.hereIsYourPort.close();
  });
}

更多详细用法可以查看官方文档。

多进程 vs 多线程

根据大学课本上的说法：“进程是资源分配的最小单位，线程是CPU调度的最小单位”，这句话应付考试就够了，但是在实际工作中，我们还是要根据需求合理选择。

下面对比一下多线程与多进程：

属性	多进程	多线程	比较
数据	数据共享复杂，需要用IPC；数据是分开的，同步简单	因为共享进程数据，数据共享简单，同步复杂	各有千秋
CPU、内存	占用内存多，切换复杂，CPU利用率低	占用内存少，切换简单，CPU利用率高	多线程更好
销毁、切换	创建销毁、切换复杂，速度慢	创建销毁、切换简单，速度很快	多线程更好
coding	编码简单、调试方便	编码、调试复杂	多进程更好
可靠性	进程独立运行，不会相互影响	线程同呼吸共命运	多进程更好
分布式	可用于多机多核分布式，易于扩展	只能用于多核分布式	多进程更好

上述比较仅表示一般情况，并不绝对。

work_thread 让 Node 有了真正的多线程能力，算是不小的进步。

React Hooks 是什么

2019-01-07T22:34:24.000Z

最近在重构 BadJS 的管理页面，使用 TypeScript + React Hooks 的技术栈，趁这个机会好好理一理 React Hooks 那些事儿。

React Hooks 是 16.7.0-alpha 版本的新特性，安装即可享用。

React Hooks 简介

React Hooks 是对 React function 组件的一种扩展，通过一些特殊的函数，让无状态组件拥有状态组件才拥有的能力。

Hooks 是 React 函数组件中的一类特殊函数，通常以 use 开头，比如 useRef，useState，useReducer 等。通常在我们写 React 组件的时候，如果这个组件比较复杂，拥有自己的生命周期或者 state，就将其写成 class 组件；如果这个组件仅仅用来展示，就将其写成 function 组件。

React Hooks 使用 function 组件的写法，通过 useState 这样的 API 解决了 function 组件没有 state 的问题，通过 useEffect 来解决生命周期的问题，通过自定义 hooks 来复用业务逻辑。

Hooks 解决哪些问题

复用与状态有关的逻辑，之前引申出来 HOC 的概念，但是 HOC 会导致组件树的臃肿。
解决组件随着业务扩展变得难以维护的问题。
使用更容易理解并且对初学者更友好的 function 组件。

用法

Hooks 主要分三种：

State hooks: 允许开发者在 function 组件中使用 state。
Effect hooks: 允许开发者在 function 组件中使用生命周期和 side effect。
Custom hooks: 自定义 hooks，可以在里面使用 State Hooks 和 Effect Hooks，达到组件之间逻辑复用。

State Hooks

看一下官方给出的 demo

import { useState } from 'react';

function Example() {
  const [count, setCount] = useState(0);

  return (
    
      You clicked {count} times</p>

这里的 useState 就是一个 hook，返回一个数组，第一个 count 表示一个 state，默认值为 0；第二个 setCount 相当于 class function 中的 setState，表示对 count 的更新操作。

这样写的好处是每个 state 独立管理，避免状态复杂的时候 state 臃肿。

基本用法描述如下：

1 2	const [state, setState] = useState(initialState); setState(newState);

useState 返回一个数组，第一个值是一个 stateful（有状态）的值，第二个值是更新这个状态值的函数。在初始渲染的时候，返回的 state 与 initialState 相同，在后续重新渲染时，useState 返回的第一个值将始终是应用更新后的最新 state(状态) 。

setState 函数用于更新 state(状态) ，它接受一个新的 state(状态) 值，并将组件排入重新渲染的队列。

由于 setState 使用函数式的更新方式，所以可以传递函数给 setState，该函数将接收先前的值，并返回更新的值。

function Counter({initialCount}) {
  const [count, setCount] = useState(initialCount);
  return (
    <>
      Count: {count}

上述代码可以使用上次的 state 来计算新的 state。与 React 类组件中的 setState 不同，useState 不会自动合并更新对象。所以如果要更新的 state 依赖前一个 state 的时候，需要使用对象扩展的方式：

setState(prevState => {
  // Object.assign 也是可行的
  return {...prevState, ...updatedValues};
});

initialState 参数既可以是一个值，也可以是一个函数，如果初始状态是高开销的计算结果，则可以改为提供函数，该函数仅在初始渲染时执行：

const [state, setState] = useState(() => {
  const initialState = someExpensiveComputation(props);
  return initialState;
});

initialState 参数只有在初始渲染期间才会使用，在随后的渲染中，它会被忽略。

Effect Hooks

Effect Hooks 允许在组件中执行副作用（side effects），类似于类中的生命周期方法。通常我们需要在 componentDidMount 和 componentDidUpdate 写一些操作，可能是更新数据，也可能是更新 Dom。除此之外，我们还会在 componentWillUnmount 的时候解绑一些事件监听防止内存泄露。这些都导致了组件维护成本的增大。而在 function 组件中，又没有这些生命周期，因此 Hooks 使用 Effect Hooks 来取代这些生命周期，完成一部分能力。

看一下官方给出的动态更改 title 的 demo：

import { useState, useEffect } from 'react';

function Example() {
  const [count, setCount] = useState(0);

  // Similar to componentDidMount and componentDidUpdate:
  useEffect(() => {
    // Update the document title using the browser API
    document.title = `You clicked ${count} times`;
  });

  return (
    
      You clicked {count} times</p>

在 useEffect 之前，我们需要在 componentDidMount 和 componentDidUpdate 中同时去调用更改 title 的方法，以完成组件初始化的状态和数据更新的状态。useEffect 传递一个函数给 React，React 在组件渲染完成后和更新后调用这个函数来完成上述功能。默认情况下，它在第一次渲染之后和每次更新之后都运行。

可以将 useEffect Hook 视为 componentDidMount，componentDidUpdate 和 componentWillUnmount 的组合。

那 useEffect 什么时候执行 componentWillUnmount 的操作呢？

如果 useEffect 中返回一个函数，在 React 卸载当前的组件的时候，会执行这个函数，用于清理 effect。

对比需要清理 effect 和不需要清理 effect 的两种写法：

function FriendStatusWithCounter(props) {
  const [count, setCount] = useState(0);
  useEffect(() => {
    document.title = `You clicked ${count} times`;
  });

  const [isOnline, setIsOnline] = useState(null);
  useEffect(() => {
    ChatAPI.subscribeToFriendStatus(props.friend.id, handleStatusChange);
    return () => {
      ChatAPI.unsubscribeFromFriendStatus(props.friend.id, handleStatusChange);
    };
  });

  function handleStatusChange(status) {
    setIsOnline(status.isOnline);
  }

  return (/*...*/);
}

通过跳过 Effect 来优化性能。

通常，每次组件渲染或者更新都去执行某些逻辑会带来无谓的消耗，所以我们经常会写这样的代码：

componentDidUpdate(prevProps, prevState) {
  if (prevState.count !== this.state.count) {
    document.title = `You clicked ${this.state.count} times`;
  }
}

只有组件更新前后的 state.count 发生变化的时候，才去更新 title。

用 Hooks 可以更简单地处理这个问题

1
2
3

useEffect(() => {
  document.title = `You clicked ${count} times`;
}, [count]); // Only re-run the effect if count changes

给 useEffect 传入第二个参数，这个参数是一个数组。如果组件重新渲染，只有这个 count 发生变化的时候 React 才会执行函数中的内容，否则会直接跳过这个 effect。如果数组中是多个参数，那么只要其中一个发生变化，React 都会执行函数中的内容。

这也适用于具有清理阶段的 effect ：

useEffect(() => {
  ChatAPI.subscribeToFriendStatus(props.friend.id, handleStatusChange);
  return () => {
    ChatAPI.unsubscribeFromFriendStatus(props.friend.id, handleStatusChange);
  };
}, [props.friend.id]); // Only re-subscribe if props.friend.id changes

如果希望 effect 只在组件 componentDidMount 和 componentWillUnmount 的时候执行，则只需要给第二个参数传一个空数组即可。传入一个空数组 [] 输入告诉 React 你的 effect 不依赖于组件中的任何值，因此该 effect 仅在 mount 时运行，并且在 unmount 时执行清理，从不在更新时运行。

Hooks 的规则

React Hooks 其实不仅仅是功能层面的增强，也给 React 注入了新的软件思想。这就是最近几年开始流行的 “约定大于配置”，比如 Hooks 函数必须使用 use 开头，还有接下来要讲的规则。前面在我的文章 webpack4 新特性也提到了这个内容。

只在顶层调用 Hooks

Hooks 只能在顶层调用，不要在循环，条件或嵌套函数中调用 Hook。原因是 React 需要保证每次组件渲染的时候都以相同的顺序调用 Hooks。

假如一个组件中有多个 Hooks，React 如何知道哪个 state(状态) 对应于哪个 useState 调用呢？答案是 React 依赖于调用 Hooks 的顺序。本质上来说 Hooks 就是数组（React hooks: not magic, just arrays）。每次执行 useState 都会改变下标，如果 useState 被包裹在 condition 中，那每次执行的下标就可能对不上，导致 useState 更新错数据。

只能在 React Function 中调用 Hooks

Hooks 只能在 React function 组件中调用，或者在自定义 Hooks 中调用。通过遵循此规则，可以确保组件中的所有 stateful （有状态）逻辑在其源代码中清晰可见。

eslint

eslint-plugin-react-hooks 可以保证强制执行上述两个规则。

1	$ npm install eslint-plugin-react-hooks@next

// Your ESLint configuration
{
  "plugins": [
    // ...
    "react-hooks"
  ],
  "rules": {
    // ...
    "react-hooks/rules-of-hooks": "error"
  }
}

自定义 Hooks

自定义 Hooks 就是将组件之间需要共有的逻辑抽出来写成单独的函数。与一般的函数的区别是，自定义 Hooks 是一个以 use 开头的函数，内部可以调用其它的 Hooks。

import { useState, useEffect } from 'react';

function useFriendStatus(friendID) {
  const [isOnline, setIsOnline] = useState(null);

  function handleStatusChange(status) {
    setIsOnline(status.isOnline);
  }

  useEffect(() => {
    ChatAPI.subscribeToFriendStatus(friendID, handleStatusChange);
    return () => {
      ChatAPI.unsubscribeFromFriendStatus(friendID, handleStatusChange);
    };
  });

  return isOnline;
}

export useFriendStatus;

在另外一个组件中，将其引入后，就可以使用了

import {useFriendStatus} from 'hooks/xxx.js';

function FriendListItem(props) {
  const isOnline = useFriendStatus(props.friend.id);

  return (
    color: isOnline ? 'green' : 'black' }}>
      {props.friend.name}
    </li>
  );
}

可以看出，自定义 Hooks 就是一个 JavaScript 函数而已，并没有什么特别。不过需要注意的是，自定义 Hooks 函数也必须以 use 开头（规约优先）。

useContext

1	const context = useContext(Context);

接受一个 context（上下文）对象（从 React.createContext 返回的值）并返回当前 context 值，当提供程序更新时，此 Hook 将使用最新的 context 值触发重新渲染。

useReducer

1	const [state, dispatch] = useReducer(reducer, initialState);

useReducer 可以理解为 Redux 的 Hooks，接受的第一个参数是 (state, action) => newState 的 reducer，并返回与 dispatch 方法配对的当前状态。

const initialState = {count: 0};

function reducer(state, action) {
  switch (action.type) {
    case 'reset':
      return initialState;
    case 'increment':
      return {count: state.count + 1};
    case 'decrement':
      return {count: state.count - 1};
    default:
      // A reducer must always return a valid state.
      // Alternatively you can throw an error if an invalid action is dispatched.
      return state;
  }
}

function Counter({initialCount}) {
  const [state, dispatch] = useReducer(reducer, {count: initialCount});
  return (
    <>
      Count: {state.count}

useReducer 接受可选的第三个参数 initialAction，表示在组件初始化期间执行的操作。比如利用 props 传递的值来初始化 state 的操作。


const initialState = {count: 0};

function reducer(state, action) {
  switch (action.type) {
    case 'reset':
      return {count: action.payload};
    case 'increment':
      return {count: state.count + 1};
    case 'decrement':
      return {count: state.count - 1};
    default:
      // A reducer must always return a valid state.
      // Alternatively you can throw an error if an invalid action is dispatched.
      return state;
  }
}

function Counter({initialCount}) {
  const [state, dispatch] = useReducer(
    reducer,
    initialState,
    {type: 'reset', payload: initialCount},
  );

  return (
    <>
      Count: {state.count}
      
        onClick={() => dispatch({type: 'reset', payload: initialCount})}>
        Reset
      </button>

useRef

1	const refContainer = useRef(initialValue);

useRef 返回一个可变的 ref 对象，通过 .current 属性对其进行访问，返回的对象将存留在整个组件的生命周期中。

function TextInputWithFocusButton() {
  const inputEl = useRef(null);
  const onButtonClick = () => {
    // `current` points to the mounted text input element
    inputEl.current.focus();
  };
  return (
    <>
      "text" />

useImperativeMethods

1	useImperativeMethods(ref, createInstance, [inputs]);

useImperativeMethods 与 forwardRef 共同使用，表示强制方法。通过 ref 将子组件的某个方法暴露给父组件。

子组件：

function FancyInput(props, ref) {
  const inputRef = useRef();
  useImperativeMethods(ref, () => ({
    focus: () => {
      inputRef.current.focus();
    }
  }));
  return <input ref={inputRef} ... />;
}
FancyInput = forwardRef(FancyInput);

父组件：


function FancyParent() {
  const fancyInputRef = useRef(null);
  useEffect(() => {
    fancyInputRef.current.focus(); 
  });

  return (
    
  );
}

useLayoutEffect

用法与 useEffect 相同，但在所有 DOM 变化后同步触发。使用它来从 DOM 读取布局并同步重新渲染。在浏览器绘制之前 useLayoutEffect 将同步刷新。

useEffect 中的函数会在 layout(布局) 和 paint(绘制) 后触发。这使得它适用于许多常见的 side effects ，例如设置订阅和事件处理程序，因为大多数类型的工作不应阻止浏览器更新屏幕。

但是如果 effect 不能够推迟，比如要 DOM 改变必须在下一次绘制之前同步触发，使用 useLayoutEffect 会更加合适。

Hooks API

参考 Hooks API Reference

总结

Hooks 通过设定某些特殊函数，在 React 组件内部“钩住”其生命周期和 state，帮助开发者解决一些逻辑复用的问题，通过自定义的 Hooks 对代码进行抽象，让我们写出更加符合函数式编程的规范，同时也减少了层层嵌套带来的问题。

参考文档

Koa 源码研读

2018-12-05T23:06:57.000Z

简介

Koa 是一个非常轻量的 web 开发框架，由 Express 团队打造。相较于 Express，Koa 使用 async 函数解决异步的问题，并且完全脱离中间件，非常优雅，而且 Koa 代码简洁友好，很适合初学者阅读。

Koa 代码结构

可以看到 Koa 的结构非常简单，lib 文件夹下面放着 koa 的核心文件：

application.js

application 是 koa 的入口文件，export 出一个 Application 的类（继承自 events.Emitter）。application 有以下几个主要（public）的 api：

listen: 实现对 http.createServer() 的封装，传入的参数 callback 中完成中间件合并，错误监听以及上下文的创建和 request 的处理。
use: 我们通常使用 app.use(function) 将中间件添加到应用程序。use 方法中，koa 将中间件（函数）添加到 this.middleware 数组中。
callback: koa-compose 将中间件组合在一起, 然后返回一个 request 回调函数，同时给 listen 作为回调。
toJSON: 返回一个去除私有属性（_开头）的对象。

module.exports = class Application extends Emitter {
  listen(...args) {
    debug('listen');
    const server = http.createServer(this.callback());
    return server.listen(...args);
  }
  
  use(fn) {
    if (typeof fn !== 'function') throw new TypeError('middleware must be a function!');
    this.middleware.push(fn);
    return this;
  }
  
  callback() {
    const fn = compose(this.middleware);
    
    if (!this.listenerCount('error')) this.on('error', this.onerror);
    
    const handleRequest = (req, res) => {
      const ctx = this.createContext(req, res);
      return this.handleRequest(ctx, fn);
    };
  
    return handleRequest;
  }
}

context.js

context 是我们在使用 koa 中最常接触到的 ctx，就是一个暴露出来的对象。context 中实现了对 cookie 的 get set 操作，这也是我们可以直接使用 ctx 对 cookie 操作的原理。除此之外，ctx 中最重要的是 delegate，也就是委托。我们简单看一下代码：

delegate(proto, 'response')
  .method('attachment')
  .method('redirect')
  .method('remove')
  .method('vary')
  .method('set')
  .method('append')
  .method('flushHeaders')
  .access('status')
  .access('message')
  .access('body')
  .access('length')
  .access('type')
  .access('lastModified')
  .access('etag')
  .getter('headerSent')
  .getter('writable');

以上的 proto 就是 ctx，实现了对 response 对象的代理，比如我们可以通过使用 ctx.status 来访问 ctx.response.status。

同样的，request 上面的属性和方法也被代理到了 ctx 中：


delegate(proto, 'request')
  .method('acceptsLanguages')
  .method('acceptsEncodings')
  .method('acceptsCharsets')
  .method('accepts')
  .method('get')
  .method('is')
  .access('querystring')
  .access('idempotent')
  .access('socket')
  .access('search')
  .access('method')
  .access('query')
  .access('path')
  .access('url')
  .access('accept')
  .getter('origin')
  .getter('href')
  .getter('subdomains')
  .getter('protocol')
  .getter('host')
  .getter('hostname')
  .getter('URL')
  .getter('header')
  .getter('headers')
  .getter('secure')
  .getter('stale')
  .getter('fresh')
  .getter('ips')
  .getter('ip');

ctx.hostname 即是 ctx.request.hostname。

request.js && response.js

request.js 和 response.js 中完成对 Koa Request/Response 对象的封装，可以通过 request.xxx/response.xxx 对其进行操作。其中使用了很多 get 和 set 方法。

实现一个简单的 moa

首先需要完成对 http 模块的封装，可以使用创建服务器。
然后完成 request 和 response 对象的封装，以及将其代理到 context 对象上。
然后需要处理中间件以及实现洋葱模型。
最后需要完成对错误的处理和异常捕获。

使用 SRI 解决 CDN 劫持

2018-11-25T13:05:48.000Z

SRI 简介

SRI 全称 Subresource Integrity - 子资源完整性，是指浏览器通过验证资源的完整性（通常从 CDN 获取）来判断其是否被篡改的安全特性。

通过给 link 标签或者 script 标签增加 integrity 属性即可开启 SRI 功能，比如：

<script type="text/javascript" src="//s.url.cn/xxxx/xxx.js?_offline=1" integrity="sha256-mY9nzNMPPf8oL3CJss7THIEoXAC2ToW1tEX0NBhMvuw= sha384-ncIKElSEk2OR3YfjNLRSY35mzt0CUwrpNDVS//iD3dF9vxrWeZ7WPlAPJTqGkSai" crossorigin="anonymous">script>

integrity 值分成两个部分，第一部分指定哈希值的生成算法（sha256、sha384 及 sha512），第二部分是经过 base64 编码的实际哈希值，两者之间通过一个短横（-）分割。integrity 值可以包含多个由空格分隔的哈希值，只要文件匹配其中任意一个哈希值，就可以通过校验并加载该资源。上述例子中我使用了 sha256 和 sha384 两张 hash 方案。

备注：crossorigin="anonymous" 的作用是引入跨域脚本，在 HTML5 中有一种方式可以获取到跨域脚本的错误信息，首先跨域脚本的服务器必须通过 Access-Controll-Allow-Origin 头信息允许当前域名可以获取错误信息，然后是当前域名的 script 标签也必须声明支持跨域，也就是 crossorigin 属性。link、img 等标签均支持跨域脚本。如果上述两个条件无法满足的话，可以使用 try catch 方案。

为什么要使用 SRI

在 Web 开发中，使用 CDN 资源可以有效减少网络请求时间，但是使用 CDN 资源也存在一个问题，CDN 资源存在于第三方服务器，在安全性上并不完全可控。

CDN 劫持是一种非常难以定位的问题，首先劫持者会利用某种算法或者随机的方式进行劫持（狡猾大大滴），所以非常难以复现，很多用户出现后刷新页面就不再出现了。之前公司有同事做游戏的下载器就遇到这个问题，用户下载游戏后解压不能玩，后面通过文件逐一对比找到原因，原来是 CDN 劫持导致的。怎么解决的呢？听说是找 xx 交了保护费，后面也是利用文件 hash 的方式，想必原理上也是跟 SRI 相同的。

所幸的是，目前大多数的 CDN 劫持只是为了做一些夹带，比如通过 iframe 插入一些贴片广告，如果劫持者别有用心，比如 xss 注入之类的，还是非常危险的。

开启 SRI 能有效保证页面引用资源的完整性，避免恶意代码执行。

浏览器如何处理 SRI

当浏览器在 script 或者 link 标签中遇到 integrity 属性之后，会在执行脚本或者应用样式表之前对比所加载文件的哈希值和期望的哈希值。
当脚本或者样式表的哈希值和期望的不一致时，浏览器必须拒绝执行脚本或者应用样式表，并且必须返回一个网络错误说明获得脚本或样式表失败。

使用 SRI

通过使用 webpack 的 html-webpack-plugin 和 webpack-subresource-integrity 可以生成包含 integrity 属性 script 标签。

import SriPlugin from 'webpack-subresource-integrity';
 
const compiler = webpack({
    output: {
        crossOriginLoading: 'anonymous',
    },
    plugins: [
        new SriPlugin({
            hashFuncNames: ['sha256', 'sha384'],
            enabled: process.env.NODE_ENV === 'production',
        })
    ]
});

那么当 script 或者 link 资源 SRI 校验失败的时候应该怎么做呢？

比较好的方式是通过 script 的 onerror 事件，当遇到 onerror 的时候重新 load 静态文件服务器之间的资源：

1
2
3


">

%3Cscript%3Ealert('XSS')%3C/script%3E

XSS')">
XSS')">
'),1)">
（这个仅限IE有效）

XSS 预防

XSS 之所以会发生，是因为用户输入的数据变成了代码。所以我们需要对数据进行 HTML Encode 处理，将其中的特殊字符进行编码。

HTML character	HTML Encoded
<	`<`
>	`>`
&	`&`
’	`'`
"	`"`
空格

将重要的 cookie 标记为 HTTP Only。
只允许用户输入期望的数据。
对数据进行 HTML Encode 处理。

过滤或者移除特殊的 HTML 标签，如果

html:
1
2
3
4
5
6
<ol id="sites">
  <li class="checked">Appleli>
  <li>Googleli>
  <li class="checked">Amazonli>
  <li>Facebookli>
ol>
css
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
li {
  font-size: 14px;
  line-height: 1.5;
  cursor: pointer;
}

li:before {
  color: #7cfc00;
  background: #fff;
  border: 2px solid #d3d3d3;
  content: " ";
  width: 16px;
  height: 16px;
  line-height: 1;
  margin-left: -38px;
  position: absolute;
  text-align: center;
  vertical-align: middle;
  cursor: pointer;
  pointer-events: all;
}

li.checked:before {
  background: green;
  border: 2px solid green;
  color: #fff;
  content: "\2714";
}
最后
在网上还有很多关于伪元素的用法，非常有趣，既能减少 DOM 元素数量，还能用 CSS 实现一部分 JS 的功能，非常酷炫，后面见到有趣的用法会不断记录。



CSS 伪元素基本用法
2017-12-08T18:06:19.000Z
伪元素
CSS 中可以利用伪元素给 DOM 元素添加特殊的样式。比如说，我们可以通过 :before 在一个元素前增加一些文本，并为这些文本添加样式。虽然用户可以看到这些文本，但是这些文本实际上不在文档树中。
CSS3 规范中要求使用双冒号(::)添加伪元素，用以区分伪元素和伪类，比如 ::before 是伪元素，:hover 是伪类。但是大部分伪元素依然支持单冒号的形式，::before 写成 :before 也可以，为了向后兼容，一般推荐使用单冒号的形式。
支持单双冒号的伪元素有： :before/::before，:after/::after，:first-letter/::first-letter，:first-line/::first-line。
仅支持双冒号的伪元素有： ::selection，::placeholder，::backdrop。
:before & :after
:before 和 :after 可以在元素前面或者后面插入内容，用 content 属性表示要插入的内容，这个虚拟元素默认是行内元素，可以配合其它样式使用。
html:
1
<p> p>
css:
1
2
3
4
5
6
7
8
p:before {
  content: 'Hello';
  color: red;
}
p:after {
  content: 'World';
  color: black;
}
p 元素会显示 Hello World，但是被插入的内容实际上不在文档树中。
:first-letter
:first-letter 用来获取元素中文本的首字母，被修饰的首字母不在文档树中。注意没有 :last-letter。
首行只在 block-container box 内部才有意义, 因此 :first-letter 伪元素 只在 display 属性值为 block, inline-block, table-cell, list-item 或者 table-caption 的元素上才起作用。 其他情况下 :first-letter 毫无意义。
:first-letter 的优先级低于 :before，也就是如果元素用 :before 先插入文本，会获取 before 伪元素中的内容。
html:
1
<p>Worldp>
css:
1
2
3
4
5
6
7
p:before {
  content: 'Hello ';
}
p:first-letter {
  font-size: 40px;
  color: red;
}
这时，:first-letter 实际获取的元素是 ：before 中的 H。
注意： 在一个使用了 :first-letter 伪元素的选择器中，只有很小的一部分 css 属性能被使用 ::first-letter
:first-line
:first-line 用来获取 块状元素 中的第一行文本，不能用于内联元素。
html:
1
<h1>Hellobr>Worldh1>
css:
1
2
3
h1:first-line {
  background: orange;
}
在一个使用了 ::first-line 伪元素的选择器中，只有很小的一部分css属性能被使用 ::first-line
::selection
::selection 伪元素应用于文档中被用户高亮的部分（比如使用鼠标或其他选择设备选中的部分），该伪元素只支持双冒号的形式。
只有 Gecko 引擎需要加前缀（-moz）
1
2
3
4
5
6
7
::-moz-selection {
  background: orange;
}
 
::selection  {
  background: orange;
}
注意： 只有一小部分 CSS 属性可以用于 ::selection 选择器： color, background-color, cursor, outline, text-decoration, text-emphasis-color 和 text-shadow。要特别注意的是，background-image 会如同其他属性一样被忽略。
::placeholder (试验性质)
:placeholder 匹配占位符的文本，只有元素设置了 placeholder 属性时，该伪元素才能生效。在一些浏览器中（IE10 和 Firefox18 及其以下版本）会使用单冒号的形式。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
input::-moz-placeholder {
  color: #666;
}
 
input::-webkit-input-placeholder {
  color: #666;
}
 
/* IE 10 only */
input:-ms-input-placeholder {
  color: #666;
}
 
/* Firefox 18 and below */
input:-moz-input-placeholder {
  color: #666;
}
::backdrop (试验性质)
用于改变全屏模式下背景色，全屏模式默认背景色为黑色。
1
2
3
h1:fullscreen::backdrop {
  background: orange;
}
参考文章
MDN - Pseudo-elements
summary-of-pseudo-classes-and-pseudo-elements/


HTML meta 标签
2017-12-02T15:22:13.000Z
引言
最近做的一个关于电影的网站 IMDB Top250，想对其进行 SEO 优化，用到 meta 信息的时候，很多知识都是 『似乎』、『好像』、『可能』 的感觉，回想自己一直没有系统的学习过 meta 相关的知识，这些东西虽然简单，但是很多时候能发挥出意想不到的效果，尤其对于 SEO 有非常重要的作用。
meta 简介
meta 标签位于文档的头部，可提供有关页面的元信息（meta-information）。 meta 标签本身不包含任何内容，通过其属性定义了与文档相关联的内容。
meta 标签一共有五个属性值： charset、content、http-equiv、name、scheme。 其中 http-equiv 和 name
必须与 content 配合组成键值对使用， charset 为 HTML5 属性， scheme 属性 HTML5 不支持。
charset
定义 HTML 文档编码方式，一般使用世界通用语言编码 UTF-8。
1
<meta charset="UTF-8">
在 HTML4 中的写法是
1
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
http-equiv
http-equiv 为枚举属性，与 content 属性组成键值对，一般用于服务器向浏览器传回一些特定的信息，以帮助浏览器编译和显示页面内容。虽然有些服务器会发送许多这种键值对，但是所有服务器都至少要发送一个：content-type:text/html。这将告诉浏览器准备接收一个 HTML 文档。
http-equiv 可枚举的值有： content-type, default-style, refresh。
1
<meta http-equiv="refresh" content="3;URL=https://lz5z.com">
以上表示页面 3 秒后自动跳转。
name
name 属性是用的最多的属性，常用的有 description，keywords，author，viewport，generator 等等。
其中 keywords 对应 content 用逗号分隔，description 为搜索引擎显示网页时候的简介。
viewport 用于指定视窗的属性，在移动端开发时显得尤为重要。
1
2
3
<meta name="keywords" content="HTML5,meta">
<meta name="description" content="blabla">
<meta name="viewport" content="width=device-width,initial-scale=1,maximum-scale=1,user-scalable=no">
还有一些属性值，比如 referrer，robots，renderer。
(1) referrer 控制所有从该文档发出的 HTTP 请求中 HTTP Referer 头的内容：
1
<meta name="referer" content="always">
referrer 对应的 content 属性可取的值：
no-referrer不要发送 HTTP Referer 首部。
origin发送当前文档的 origin。
no-referrer-when-downgrade当目的地是先验安全的(https->https)则发送 origin 作为 referrer ，但是当目的地是较不安全的 (https->http)时则不发送 referrer 。这个是默认的行为。
origin-when-crossorigin在同源请求下，发送完整的URL (不含查询参数) ，其他情况下则仅发送当前文档的 origin。
unsafe-URL在同源请求下，发送完整的URL (不含查询参数)。
HTTP Referer 头：
Referer 请求头字段允许由客户端指定资源的 URI 来自于哪一个请求地址，这对服务器有好处。Referer 请求头让服务器能够拿到请求资源的来源，可以用于分析用户的兴趣爱好、收集日志、优化缓存等等。同时也让服务器能够发现过时的和错误的链接并及时维护。
注意：动态地插入  (通过 document.write 或者 appendChild) 是不起作用的。同样注意如果同时有多个彼此冲突的策略被定义，那么 no-referrer 策略会生效。
(2) robots 用来告诉搜索引擎的爬虫哪些页面需要索引，哪些不需要索引。
1
<meta name="robots" content="all">
robots 对应的 content 可取的值：
all：文件将被检索，且页面上的链接可以被查询。
none：文件将不被检索，且页面上的链接不可以被查询。
index：文件将被检索。
follow：页面上的链接可以被查询。
noindex：文件将不被检索，但页面上的链接可以被查询。
nofollow：文件将被检索，但页面上的链接不可以被查询。
还有一些只有固定的搜索引擎支持的参数，比如 noodp，noarchive 等，这里就不说明了。
(3) renderer
renderer 并不是 w3c 标准，但却经常见于一些网页中，这个属性主要用于双核或者多核浏览器（猎豹浏览器，360浏览器）使用指定的内核处理自己的网页。目前大多数 「双核」 浏览器内部的两个内核分别是 IE 内核和 WebKit 内核，IE 内核主要用于兼容「老一辈」的网页，使其能够正常显示；WebKit 内核则用于渲染「新一代」的网页，从而发挥出更快的显示速度、更好的显示效果、更优异的脚本执行性能。
作为用户来说并不关心你使用哪个内核，简单易用才是王道，因此在网页中设置首选内核会让网页有更好的效果。
1
2
<meta name="renderer" content="webkit">
<meta name="renderer" content="webkit|ie-stand">
renderer 对应的 content 用于指定浏览器内核，
webkit(WebKit 内核)、ie-stand(IE 内核-标准模式)、ie-comp(IE 内核-兼容模式)。我们也可以同时指定多个内核名称，之间以符号"|"进行分隔，此时浏览器将会按照从左到右的先后顺序选择其具备的渲染内核来处理当前网页。
IE8 有自己独特的写法 X-UA-Compatible 对于 IE8 之外的浏览器是不识别的。
1
2
3
4
5
// Edge 模式通知 IE 以最高级别的可用模式显示内容
<meta http-equiv="X-UA-Compatible" content="edge"/>

// 如果 IE 有安装 Google Chrome Frame，那么就走安装的组件，如果没有就和上面一样。
<meta http-equiv="X-UA-Compatible" content="IE=edge,chrome=1"/>
注： 如果设置浏览器内核为 Webkit (极速模式)，打开网页后却为 IE (兼容模式)，尝试刷新浏览器则会自动切换模式。
通常是这样设置的
1
2
<meta name="renderer" content="webkit">
<meta http-equiv="X-UA-Compatible" content="IE=edge,chrome=1">
(4) format-detection
防止 ios 把数字/字符串识别为电话/邮件/日期/地址
1
2
3
4
<meta name="format-detection" content="telephone=no">
<meta name="format-detection" content="date=no">
<meta name="format-detection" content="address=no">
<meta name="format-detection" content="email=no">
参考资料
MDN-meta
关于控制 Referer 你想要知道的一切


迁移 github pages 到 coding.net
2017-10-27T15:37:59.000Z
由于众所周知的原因，github 在国内时不时不能访问，虽然有各种办法可以跨越屏障，但是你不能用预测未来会发生哪些事情，于是决定将博客迁移到国内，coding 是一个不错的选择，主要有以下几个优点。
国内速度更快
自带 SSL，且免费
五个免费的私人仓库
功能较全: pages, webIDE, CI 等
经过一段时间迭代，产品经得起考验
步骤
首先直接从 github 把 blog 项目导入到 coding，项目名称命名为 [name].coding.me，相当于 github 上面的 [name].github.io。
进入项目代码，点击左侧 『代码 -> Pages 服务』，选择静态 Pages 服务，coding 部署来源仅支持 coding-pages 分支和 master 分支，所以选择 master 分支。
这时，通过 [name].coding.me 就能够访问页面了，但是这还远远不够，我们还需要添加自定义域名和开启 SSL 服务。
自定义域名 SSL
首先确保项目根目录中有 CNAME 文件，里面是自己的域名，比如我的域名 lz5z.com，然后在 coding 页面自定义域名中输入此域名，并且开启强制 HTTPS 访问。
然后去自己域名服务商那里修改 DNS Server，我的域名在万网购买，于是在万网控制台添加一个 CNAME 记录和一个 A 记录，加上之前 github pages 添加的主机记录，截图如下。
红色部分为新添加的记录，如果不知道 coding.net 的 ip 地址的话，可以手动 ping 一下。
由于之前使用 cloudflare 的免费 SSL 服务而将 DNS Server 的地址指向了 cloudflare，这个时候把地址改回万网默认配置即可。
经过漫长的等待，DNS 解析生效，此时通过 https://lz5z.com 访问，发现域名已经生效了，但是存在两个问题：
国内地址访问网站， SSL 没有问题，但是国外访问时 SSL 会报错，在 chrome 中有一个不能忍受的警告。
每次访问博客地址的时候，首先会看到一个 coding 的广告，然后再重定向到自己要访问的地址，这也是不能忍受的。
解决 SSL 证书错误
国外地址访问网站报 SSL 不合法主要是因为这个原因：
注意：申请 SSL/TLS 证书需要通过 Let’s Encrypt 的 HTTP 方式验证域名所有权。如果您的域名在境外无法访问 Coding Pages 的服务器，将导致 SSL/TLS 证书申请失败。
查阅资料发现大家的解决方式都是设置双线解析，也就是国外访问通过 github pages，国内访问通过 coding.net，因此要为域名设置解析路线，如果域名服务商自定义解析路线，可以选择免费的 DNSPod 做 DNS 解析。
DNSPod 提供双线解析的原理我不是很明白，而且比较困惑的是 github pages 自定义域名原生是不资辞 SSL 的，之前的做法是使用 cloudflare 的 SSL 服务进行重定向，假如使用双线解析的话，那国外地址为什么能够看到合法的 SSL 呢？
而且按照网上的做法改了 DNS 解析后，并没有发生双线解析，无论是国外还是国内都是解析到 coding.net，但是解决了国外地址访问报 SSL 证书错误的问题。着实很奇怪，以下是我的做法。
DNSPod
注册 -> 登录 -> 实名认证 -> 进入控制台 -> 添加域名
添加域名的时候 DNSPod 会自动监测域名之前的解析情况，然后用 DNSPod 服务器提供的 DNS 地址替代万网提供的地址。
DNSPod DNS 记录如下：
更改万网 DNS Server 为 DNSPod:
再次经过漫长的等待，DNS 生效后，无论国内国外访问网站都是合法的 SSL，excited！
解决 coding 广告后重定向
每次新建隐私窗口打开网站都是先看 coding 的广告，然后再重定向到之前的地址，这是极差的用户体验，不过 coding 官方提供了解决办法，简单的就是购买 coding 的会员，免费的办法就是在网站首页任意位置放置「Hosted by Coding Pages」的文字版或图片版，具体办法参考 coding pages 服务的说明。添加之后勾选 已放置 Hosted by Coding Pages，等待一天或者两天就生效了。
总结
这次切换 github pages 到 coding.net 真的费时费力，不过好在现在网页能够正常访问，而且速度也比之前快很多，所以还是比较满意的。


解决 webpack 打包后 z-index 重新计算的问题
2017-10-24T13:18:37.000Z
背景
与 PC 端共同开发一个页面，页面由 PC 端提供，内部 iframe 则由我们前端提供。开发时候遇到了一个问题，webpack 打包后 css 的 z-index 值与原始值不符，导致 iframe 里面的 toast 被外面 z-index 较小的 dialog 覆盖。更改 toast 的 z-index，发现没起作用，页面上的 z-index 依然是之前的值，而不是 css 中赋予的值。给 z-index 加上 !important 后依然无效，查资料发现是 OptimizeCssAssetsPlugin 调用 cssProcessor cssnano 对 z-index 进行了重新计算导致的。
这本来是 webpack 插件的一个善举（让 z-index 数值更加合理），但是具体情况来看，这里显然不需要这个 “善举”。
解决方案
解决方案按照网上的资料，可以在 OptimizeCssAssetsPlugin 插件中关掉 cssnano 对 z-index 的重新计算（cssnano 称为 rebase）。
1
2
3
4
5
6
7
8
9
new OptimizeCSSPlugin({
    cssProcessor: require('cssnano'),
    cssProcessorOptions: {
        discardComments: {removeAll: true},
        // 避免 cssnano 重新计算 z-index
        safe: true
    },
    canPrint: false
})
cssnano 将 z-index rebase 归类为 unsafe，只有在单个网页的 css 全部写入一个 css 文件，并且不通过 JavaScript 进行改动时是 safe。
参考： http://cssnano.co/optimisations/zindex/
cssnano 默认进行 z-index rebase。
unsafe (potential bug) 优化项默认不开启应该比较友好。
另外一个方案
以上是网上提供的方案，而且亲测有效，但是由于项目太大，因为其中一个小功能改了整个项目的 css 处理策略，难免有些担心会影响到其它页面。思考再三，决定不改 webpack 配置。
观察之前项目中使用的框架，在生成 dialog 或者 toast 的时候，即使在 webpack 插件对 css 进行处理之后，其 z-index 依然是很大的。
比如 element-ui 下 的 popup-manager.js 中首先设置 zIndex 为 2000，然后在 openModal 的时候动态添加 css 到 DOM 中，并且改变 zIndex 的值，而在浏览器中观察弹框的 z-index，果然是没有经过 cssnano rebase 的。
于是仿照 element-ui 的做法，把 z-index 相关的 css 用 js 动态插入到 DOM 中，就完美地解决了这个问题，并且没有对其它项目产生影响。
1
2
3
4
5
6
7
8
// 改变 toast 的 z-index
(function addToastStyle () {
    let nod = document.createElement('style')
    let str = `.mint-toast{z-index:2009;}`
    nod.type = 'text/css'
    nod.appendChild(document.createTextNode(str))
    document.getElementsByTagName('head')[0].appendChild(nod)
})()
总结
webpack 在对代码进行打包之前，会扫描所有的模块，建立模块之间的依赖树，而插件的运作时机也是相对于此时的静态代码，因此用 js 动态插入 css，webpack 显然不会知道要插入的 css 是什么样的，因此动态插入的 css 内容就不会经过插件的处理，也就避免了 OptimizeCssAssetsPlugin 的 “善举”。


Linux 文件权限
2017-10-10T19:06:38.000Z
linux 文件属性
linux 中用户相对于文件有三种身份：owner、group、others，每种身份各有 read、write、execute 三种权限。
使用 ls -l 命令可以查看与文件权限相关的信息：
1
2
3
4
$ ls -l
drwxr-xr-x  2 lizhen  staff  68 10 10 19:14 foo
-rw-r--r--  1 lizhen  staff   0 10 10 19:14 test.txt
lrwxr-xr-x  1 lizhen  staff  62  7 10 10:01 subl -> /Applications/Sublime Text.app/Contents/SharedSupport/bin/subl
其中第一个字符表示文件类型：d 表示文件为一个目录，- 表示文件为普通文件，l 表示链接， b 表示设备文件。
接下来的字符中，以三个为一组，且均为 r(read)、 w(write)、 x(execute) 三个参数的组合，首先三个字符表示文件所有者权限，后面三个字符表示用户组权限，最后三个表示其他人对文件的权限。这三个权限的位置不会改变，如果没有权限，就会出现减号[ - ]。
后面的字段分别代表：硬链接个数，所有者，所在组，文件或者目录大小，最后访问/修改时间，文件或者目录名。
更改文件属性
chgrp：改变文件所属群组 change group
chown：改变文件拥有者 change owner
chmod：改变文件的权限 change mod
chgrp
首先使用 groups 命令查看当前用户在哪些分组中，然后使用 chgrp 命令改变文件所属用户组
1
2
3
$ chgrp -R admin foo
$ ls -l 
drwxr-xr-x  2 lizhen  admin  68 10 10 19:14 foo
-R 表示递归更改文件属组，就是在更改某个目录文件的属组时，如果加上 -R 参数，那么该目录下的所有文件的属组都会更改。可以通过 /etc/group 查看当前系统所有的分组。
可以看到文件分组由 staff 变成了 admin。
chown
语法
1
2
chown [–R] 属主名 文件名
chown [-R] 属主名：属组名 文件名
chown 可以更改文件的 owner，也可以同时更改文件属组。假如当前系统中有一个名为 test 的用户。
1
2
3
$ sudo chown -R test foo
$ ls -l
drwxr-xr-x  2 test   admin  68 10 10 19:14 foo
此时 foo 的 owner 变成了 test。可以通过 /etc/passwd 文件查看当前系统所有的用户。
chown 还可以用户修改文件所在的分组。
1
2
3
$ sudo chown [-R] lizhen:staff foo
$ ls -l
drwxr-xr-x  2 lizhen  staff  68 10 10 19:14 foo
文件属性又变回去了。
chmod
chmod 用来更改文件属性，权限可以使用符号或数字来表示。
使用符号表示权限：
[ + ]为文件或目录增加权限
[ - ]删除文件或目录的权限
[ = ]设置指定的权限
通过使用 u(owner)、g(group)、o(other) 来代表三种身份的权限，此外 a 代表 all，即全部身份。
语法
1
chmod u/g/o/a +/-/= r/w/x filename
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
$ ls -l test.txt
-rw-r--r--  1 lizhen  staff  0 10 10 20:33 test.txt

## 修改 owner 权限增加 execute，group 和 others 减少 read
$ chmod u+x,g-r,o-r test.txt 

$ ls -l test.txt
-rwx------  1 lizhen  staff  0 10 10 20:33 test.txt

## 修改 owner 权限为 rw，group 和 others 为 r
$ chmod u=rw,g=r,o=r test.txt 

$ ls -l test.txt
-rw-r--r--  1 lizhen  staff  0 10 10 20:33 test.txt

## 增加所有用户的执行权限
$ chmod a+x test.txt

$ ls -l test.txt
-rwxr-xr-x  1 lizhen  staff  0 10 10 20:33 test.txt
使用数字改变权限：
x: 1
w: 2
r: 4
所以权限 rwx 就等于 4 + 2 + 1 = 7，也就是 chmod a=rwx file 相当于 chmod 777 file。
-rw——- (600) 只有所有者才有读和写的权限
-rw-r–r– (644) 只有所有者才有读和写的权限，组群和其他人只有读的权限
-rwx—— (700) 只有所有者才有读，写，执行的权限
-rwxr-xr-x (755) 只有所有者才有读，写，执行的权限，组群和其他人只有读和执行的权限
-rwx–x–x (711) 只有所有者才有读，写，执行的权限，组群和其他人只有执行的权限
-rw-rw-rw- (666) 每个人都有读写的权限
-rwxrwxrwx (777) 每个人都有读写和执行的权限
1
2
3
$ chmod 711 test.txt 
$ ls -l test.txt 
-rwx--x--x  1 lizhen  staff  0 10 10 20:33 test.txt



ES2016 和 ES2017 学习
2017-09-12T16:26:44.000Z
ES6 发布之后，TC-39 小组每年发布一次 ECMAScript 语言新特性，这个 repository tc39/ecma262 中记录着最新版的提议。新版本的 ECMAScript 使用年份来表示版本，所以 ES6 被称为 ES2015， ES7 被称为 ES2016，所以标准起见，以后我们也称之为 ES2016 和 ES2017。
ECMAScript 2016
ES2016 只有两个新特性
Array.prototype.includes
求冥运算(Exponentiation Operator)
Array.prototype.includes
includes 查找一个值是否在数组中
1
2
[1, 2, 3].includes(3)         //true
['a', 'b', 'c'].includes('d') //false
includes 还可以接收两个参数，第一个表示要查找的值，第二个表示从数组第 N 个元素开始查找。
1
2
3
4
5
6
[1, 2, 3].includes(2)     // true
[1, 2, 3].includes(4)     // false
[1, 2, 3].includes(3, 2)  // true
[1, 2, 3].includes(3, 3)  // false
[1, 2, 3].includes(3, -1) // true
[1, 2, NaN].includes(NaN) // true
注意上面 [1, 2, NaN].includes(NaN) 的返回值为 true，虽然 NaN === NaN 的结果为 false，所以『包含』和『相等』还是有区别的。
1
2
3
4
const tt = [-0, 1, NaN]
tt.includes(0)   // true
tt.indexOf(NaN)  // -1
tt.includes(NaN) // true
测试发现 includes 和 indexOf 在 node 8 / chrome 61 下速度差异不大，因此在使用的时候不用考虑性能的问题。
在 ES2015 中，String 对象也有 includes 方法，String.prototype.includes，但是只能用于 String，不能用于 characters。
幂运算 Exponentiation operator
ES2016 新增幂运算符改进语法
1
2
3
4
5
3 ** 3 // 27
Math.pow(5, 2) === 5 ** 2 // true

let a = 3
a **= 3 // 27
幂运算符的优先级高于二元运算符，低于一元运算符。
1
2
3
4
5
6
7
8
9
2 * 5 ** 2  // 50
-(5 ** 2)   // -25
(-5) ** 2   // 25
// 运算符左侧不能是除了 ++ 或 -- 之外的任意一元表达式
-5 ** 2     // Uncaught SyntaxError: Unexpected token ** 

let num = 2
++num ** 2    // 9
num-- ** 2    // 9
ECMAScript 2017
主要新特性：
异步函数(Async/Await)
共享内存和原子(Shared memory and atomics)
小改款
Object.values() 和 Object.entries()
字符串填充(padStart 和 padEnd)
Object.getOwnPropertyDescriptors()
函数参数列表和调用中的尾逗号(Trailing commas)
async/await
async 函数声明： async function foo () {}
async 函数表达式： const foo = async function () {}
async 函数定义： let obj = { async foo () {} }
async 箭头函数： const foo = async () => {}
关于 async/await 很早以前就写过了，而且现在基本上已经成了异步代码必备了，这里就不赘述了。
详情参考JavaScript异步解决方案async/await
共享内存和原子(Shared memory and atomics)
共享内存和原子内容比较多，后面会单独写一篇文章，暂时留坑。
Object.entries() 和 Object.values()
(1) Object.entries()
该方法将一个对象中所有可枚举的属性与值按照二维数组的方式返回，如果对象是数组，则数组的下标作为键值。
1
2
Object.entries({ one: 1, two: 2}) // [['one', 1], ['two', 2]]
Object.entries([1, 2]) // [['0', 1], ['1', 2]]
返回数组的顺序与 Object.keys() 一致。
1
2
3
let obj = {3: 'a', 2: 'b', 1: 'c'}
Object.entries(obj)  // [['1', 'c'], ['2', 'b'], ['3', 'c']]
Object.keys(obj)     // ['1', '2', '3']
Object.entries() 会忽略对象中 key 为 Symbol 的键值对。
1
Object.entries({ [Symbol()]: 123, foo: 'abc' }) // [ [ 'foo', 'abc' ] ]
通过 Object.entries() 设置一个 Map 对象。
1
2
3
4
5
let map = new Map(Object.entries({
    one: 1,
    two: 2,
}))
JSON.stringify([...map])  // [["one",1],["two",2]]
通过 Object.entries() 遍历对象。
1
2
3
4
5
6
7
let obj = { one: 1, two: 2 }
for (let [k,v] of Object.entries(obj)) {
    console.log(`${JSON.stringify(k)}: ${JSON.stringify(v)}`)
}
// Output:
// "one": 1
// "two": 2
(2) Object.values()
该方法返回对象可枚举键值对中所有的 value。
1
Object.values({ one: 1, two: 2 })  // [ 1, 2 ]
字符串填充(padStart 和 padEnd)
(1) String.prototype.padStart
padStart 函数通过填充字符串首部使字符串达到一定的长度。该方法接受两个参数，第一个表示目标字符串长度，第二个表示填充内容，默认填充内容为空格。
1
2
3
4
5
'abc'.padStart(10)         // "       abc"
'abc'.padStart(10, "foo")  // "foofoofabc"
'abc'.padStart(6,"123465") // "123abc"
'abc'.padStart(8, "0")     // "00000abc"
'abc'.padStart(1)          // "abc"
(2) String.prototype.padEnd
padEnd 填充字符串的时候从尾部开始填充，其它均与 padStart 相同。
1
2
3
4
'abc'.padEnd(10)          // "abc       "
'abc'.padEnd(10, "foo")   // "abcfoofoof"
'abc'.padEnd(6, "123456") // "abc123"
'abc'.padEnd(1)           // "abc"
Object.getOwnPropertyDescriptors()
该方法获取目标对象所有属性的属性描述符，该属性必须是自己定义的，不能是通过原型链继承来的。
关于属性描述符的作用，可以查看使用 Object.defineProperty 为对象定义属性
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
const obj = {
    [Symbol('foo')]: 123,
    get bar() { return 'abc' },
};
console.log(Object.getOwnPropertyDescriptors(obj));

// Output:
// { [Symbol('foo')]:
//    { value: 123,
//      writable: true,
//      enumerable: true,
//      configurable: true },
//   bar:
//    { get: [Function: bar],
//      set: undefined,
//      enumerable: true,
//      configurable: true } }
使用 Object.assign() copy 一个对象/属性 的时候，不能正确 copy 属性的 get 和 set，而通过 getOwnPropertyDescriptors() 能够实现正确 copy 一个对象/对象属性。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
let Leo =  Object.defineProperty({}, 'name', {
    get: function() {
        return name
    },
    set: function(newName) {
        name = newName
    },
    enumerable: true,
    configurable: true
})
const result = {}
Object.assign(result, Leo)
Object.getOwnPropertyDescriptor(result, 'name')
// {value: "", writable: true, enumerable: true, configurable: true}
我们发现通过 Object.assign() copy 后的 ‘name’ 属性，其 ‘get’, ‘set’ 属性不见了
1
2
3
4
const result2 = {}
Object.defineProperties(result2, Object.getOwnPropertyDescriptors(Leo))
Object.getOwnPropertyDescriptor(result2, 'name')
// {enumerable: true, configurable: true, get: ƒ, set: ƒ}
使用 Object.getOwnPropertyDescriptors 配合 Object.defineProperties 就可以实现正确 copy 了。
函数参数列表和调用中的尾逗号(Trailing commas)
这个新特性很简单，就是允许我们在定义或者调用函数的时候参数后面多加一个逗号而不报错。
1
2
3
function foo (a, b,) {} // correct

foo ('abc', 'def',)  // correct
在数组和对象中这样的写法也没有问题。
1
2
3
4
5
6
let arr = ['red', 'green', 'blue',]

let obj = {
first: 'Leo',
last: 'Li',
}
新加入这个特性的好处就是当我们调整参数或者代码结构的时候，不需要再额外地添加或者删除逗号了，尤其是对代码进行注释的时候会方便很多。在版本管理上，不会因为出现一个逗号，导致原本只有一行的修改变成两行。
参考资料
Exploring ES2016 and ES2017


vue2 组件通信——使用 dispatch 和 broadcast
2017-09-01T09:37:44.000Z
最近在使用 Element 过程中发现组件通信大量使用 dispatch 和 broadcast 两个方法，之前在 vue2 组件通信 也提到过 vue2 中取消了 $dispatch 和 $broadcast 两个重要的事件，而 Element 重新实现了这两个函数。
代码地址放在 element-ui/lib/mixins/emitter
emitter.js
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
"use strict";

exports.__esModule = true;
function _broadcast(componentName, eventName, params) {
  this.$children.forEach(function (child) {
    var name = child.$options.componentName;

    if (name === componentName) {
      child.$emit.apply(child, [eventName].concat(params));
    } else {
      _broadcast.apply(child, [componentName, eventName].concat([params]));
    }
  });
}
exports.default = {
  methods: {
    dispatch: function dispatch(componentName, eventName, params) {
      var parent = this.$parent || this.$root;
      var name = parent.$options.componentName;

      while (parent && (!name || name !== componentName)) {
        parent = parent.$parent;

        if (parent) {
          name = parent.$options.componentName;
        }
      }
      if (parent) {
        parent.$emit.apply(parent, [eventName].concat(params));
      }
    },
    broadcast: function broadcast(componentName, eventName, params) {
      _broadcast.call(this, componentName, eventName, params);
    }
  }
};
解析
dispatch 和 broadcast 方法都需要 3 个参数，componentName 组件名称， eventName 事件名称， params 传递的参数。
dispatch 方法会寻找所有的父组件，直到找到名称为 componentName 的组件，调用其 $emit() 事件。broadcast 方法则是遍历当前组件的所有子组件，找到名称为 componentName 的子组件，然后调用其 $emit() 事件。
这里也看出了 Element 中的 dispatch 与 broadcast 的不同，vue1 中的 $dispatch 和 $broadcast 会将事件通知给所有的 父/子 组件，只要其监听了相关事件，都能够（能够，不是一定）触发；而 Element 则更像是定向爆破，指哪打哪，其实更符合我们日常的需求。
使用方式
兄弟组件之间的通信可以很好的诠释上述两个事件。假设父组件 App.vue 中引入了两个子组件 Hello.vue 和 Fuck.vue。
如果你的项目中巧合使用了 Element，那可以按照下面的方式将其引入进来，如果没有用 Element 也不用担心，复制上面的 emitter.js，通过 mixins 的方式引入即可。
在 App.vue 中监听 message 事件，收到事件后，通过 broadcast 和接收到的参数，将事件定向传播给相关组件。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
<template>
  <div id="app">
    <hello>hello>
    <fuck>fuck>
  div>
template>

<script>
  import Hello from 'components/Hello'
  import Fuck from 'components/Fuck'
  import Emitter from 'element-ui/lib/mixins/emitter'

  export default {
    name: 'app',
    componentName: 'ROOT',
    mixins: [Emitter],
    components: {
      Hello,
      Fuck
    },
    created () {
      this.$on('message', params => {
        this.broadcast(params.componentName, params.eventName, params.text)
      })
    }
  }
script>
Fuck.vue 与 Hello.vue 的内容基本相同，下面只列出 Fuck.vue
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
import Emitter from 'element-ui/lib/mixins/emitter'
import event from 'mixins/event'

export default {
  componentName: 'Fuck',
  mixins: [Emitter, event],
  data () {
    return {
      name: 'Fuck',
      textarea: '',
      tableData: []
    }
  },
  methods: {
    submit () {
      this.communicate('message', {
        componentName: 'Hello',
        text: this.textarea
      })
      this.textarea = ''
    }
  },
  created () {
    this.$on('message', text => {
      this.tableData.push(this.getMessage(text))
    })
  }
}
mixins/event.js
1
2
3
4
5
6
7
8
9
10
11
12
import Emitter from 'element-ui/lib/mixins/emitter'

export default {
  mixins: [Emitter],
  methods: {
    communicate (event, params = {}) {
      this.dispatch('ROOT', event, Object.assign({
        eventName: event
      }, params))
    }
  }
}
Fuck.vue 中监听了 message 事件，当收到消息时，向 tableData 中加入新的值。而 summit 方法则调用 event.js 中的 communicate 方法，通过 dispatch 方法将事件传播给 ROOT 组件。
完整代码地址
vue 组件通信方式总结
父组件向子组件传递信息使用 props down
子组件向父组件传递信息使用 event up
其它关系类型组件通信使用 global event bus
大型 SPA 组件之间通信使用 Vuex 管理组件状态
使用 Element 下 emitter.js 中的 dispatch 和 broadcast 做事件定向传播


图片懒加载的几种实现方式
2017-08-28T14:55:20.000Z
demo地址
懒加载
Lazyload 可以加快网页访问速度，减少请求，实现思路就是判断图片元素是否可见来决定是否加载图片。当图片位于浏览器视口 (viewport) 中时，动态设置  标签的 src 属性，浏览器会根据 src 属性发送请求加载图片。
懒加载实现
首先不设置 src 属性，将图片真正的 url 放在另外一个属性 data-src 中，在图片即将进入浏览器可视区域之前，将 url 取出放到 src 中。
懒加载的关键是如何判断图片处于浏览器可视范围内，通常有三种方法：
方法一
通过对比屏幕可视窗口高度和浏览器滚动距离与元素相对文档顶部的距离之间的关系，判断元素是否可见。
示意图如下：
代码如下：
1
2
3
4
5
6
7
function isInSight(el) {
    const clientHeight = window.innerHeight // 获取屏幕可视窗口高度
    const scrollTop = document.body.scrollTop // 浏览器窗口顶部与文档顶部之间的距离
    // el.offsetTop 元素相对于文档顶部的距离 
    // +100是为了提前加载
    return el.offsetTop <= clientHeight + scrollTop + 100
}
方法二
通过 getBoundingClientRect() 获取图片相对于浏览器视窗的位置
示意图如下：
getBoundingClientRect() 方法返回一个 ClientRect 对象，里面包含元素的位置和大小的信息
1
2
3
4
5
6
7
8
ClientRect {
bottom: 596,
height: 596,
left: 0,
right: 1920,
top: 0,
width: 1920
}
其中位置是相对于浏览器视图左上角而言。代码如下：
1
2
3
4
5
6
7
function isInSight1(el) {
    const bound = el.getBoundingClientRect() 
    const clientHeight = window.innerHeight // 表示浏览器可视区域的高度
    // bound.top 表示图片到可视区域顶部距离
    // +100是为了提前加载
    return bound.top <= clientHeight + 100 
}
方法三
使用 IntersectionObserver API，观察元素是否可见。“可见”的本质是目标元素与 viewport 是否有交叉区，所以这个 API 叫做“交叉观察器”。
实现方式
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
function loadImg(el) {
    if (!el.src) {
        const source = el.dataset.src
        el.src = source
        el.removeAttribute('data-src')
    }
}

const io = new IntersectionObserver(entries => {
for (const entry of entries) {
        const el = entry.target
        const intersectionRatio = entry.intersectionRatio
        if (intersectionRatio > 0 && intersectionRatio <= 1) {
            loadImg(el)
        }
        el.onload = el.onerror = () => io.unobserve(el)
    }
})

function checkImgs() {
    const imgs = Array.from(document.querySelectorAll('img[data-src]'))
    imgs.forEach(item => io.observe(item))
}
IntersectionObserver
IntersectionObserver 的作用就是检测一个元素是否可见，以及元素什么时候进入或者离开浏览器视口。
兼容性
Chrome 51+（发布于 2016-05-25）
Android 5+ （Chrome 56 发布于 2017-02-06）
Edge 15 （2017-04-11）
iOS 不支持
Polyfill
WICG 提供了一个 polyfill
API
1
const io = new IntersectionObserver(callback, option)
IntersectionObserver 是一个构造函数，接受两个参数，第一个参数是可见性变化时的回调函数，第二个参数定制了一些关于可见性的参数（可选），IntersectionObserver 实例化后返回一个观察器，可以指定观察哪些 DOM 节点。
下面是一个最简单的应用：
1
2
3
4
5
6
7
8
// 1. 获取 img
const img = document.querySelector('img')
// 2. 实例化 IntersectionObserver，添加 img 出现在 viewport 瞬间的回调
const observer =  new IntersectionObserver(changes => { 
  console.log('我出现了！') 
});
// 3. 开始监听 img
observer.observe(img)
(1) callback
回调 callback 接受一个数组作为参数，数组元素是 IntersectionObserverEntry 对象。IntersectionObserverEntry 对象上有7个属性，
1
2
3
4
5
6
7
8
9
IntersectionObserverEntry {
time: 72.15500000000002, 
rootBounds: ClientRect, 
boundingClientRect: ClientRect, 
intersectionRatio: 0.4502074718475342,
intersectionRect: ClientRect, 
isIntersecting: true,
target: img
}
boundingClientRect: 对 observe 的元素执行 getBoundingClientRect 的结果
rootBounds: 对根视图执行 getBoundingClientRect 的结果
intersectionRect: 目标元素与视口（或根元素）的交叉区域的信息
target: observe 的对象，如上述代码就是 img
time: 过了多久才出现在 viewport 内
intersectionRatio：目标元素的可见比例，intersectionRect 占 boundingClientRect 的比例，完全可见时为1，完全不可见时小于等于0
isIntersecting: 目标元素是否处于视口中
(2) option
假如我们需要特殊的触发条件，比如元素可见性为一半的时候触发，或者我们需要更改根元素，这时就需要配置第二个参数 option 了。
通过设置 option 的 threshold 改变回调函数的触发条件，threshold 是一个范围为0到1数组，默认值是[0]，也就是在元素可见高度变为0时就会触发。如果赋值为 [0, 0.5, 1]，那回调就会在元素可见高度是0%，50%，100%时，各触发一次回调。
1
2
3
4
5
6
7
const observer =  new IntersectionObserver((changes) => { 
  console.log(changes.length); 
}, {
  root: null, 
  rootMargin: '20px', 
  threshold: [0, 0.5, 1]
});
root 参数默认是 null，也就是浏览器的 viewport，可以设置为其它元素，rootMargin 参数可以给 root 元素添加一个 margin，如 rootMargin: '20px' 时，回调会在元素出现前 20px 提前调用，消失后延迟 20px 调用回调。
(3) 观察器
1
2
3
4
5
6
7
8
9
10
11
12
// 开始观察
io.observe(document.getElementById('root'))

// 观察多个 DOM 元素
io.observe(elementA)
io.observe(elementB)

// 停止观察
io.unobserve(element)

// 关闭观察器
io.disconnect()
使用 IntersectionObserver 优势
使用前两种方式实现 lazyload 都需要监听浏览器 scroll 事件，而且要对每个目标元素执行 getBoundingClientRect() 方法以获取所需信息，这些代码都在主线程上运行，所以可能造成性能问题。
Intersection Observer API 会注册一个回调方法，每当期望被监视的元素进入或者退出另外一个元素的时候(或者浏览器的视口)该回调方法将会被执行，或者两个元素的交集部分大小发生变化的时候回调方法也会被执行。通过这种方式，网站将不需要为了监听两个元素的交集变化而在主线程里面做任何操作，并且浏览器可以帮助我们优化和管理两个元素的交集变化。
参考资料
原生 JS 实现最简单的图片懒加载
IntersectionObserver
IntersectionObserver API 使用教程
MDN-Intersection Observer API


service worker 使用
2017-07-09T20:05:46.000Z
service worker 简介
service worker 的功能和特性可以总结为以下几点：
service worker 是一个独立 worker 线程，独立于当前网页进程，有自己独立的 worker context
service worker 的线程能力基于 webworker 而生，通过 postMessage 和 onMessage 进行线程之间的通信；缓存机制是依赖 cache API 实现的。service worker = webworker + cache API
一旦被 install 之后，就永远存在，除非被 uninstall；需要的时候可以直接唤醒，不需要的时候自动睡眠
可以可编程拦截代理请求( https 请求)和缓存文件，缓存的文件直接可以被网页进程取到（包括网络离线状态）
离线内容开发者可控；能向客户端推送消息；不能直接操作 dom
必须在 https 环境下才能工作，当然 localhost 或者 127.0.0.1 也是 ok 的
service worker 是异步的，内部通过 Promise 实现， localStorage 是同步的，因此 service worker 内不许用使用 loaclStorage
依赖 HTML5 fetch API 和 Promise
service worker 使用
注册
1
2
3
4
5
6
7
8
9
10
11
12
13
14
if ('serviceWorker' in navigator) {
    window.addEventListener('load', function () {
        navigator.serviceWorker.register('/sw.js', {scope: '/'})
            .then(function (registration) {
                // 注册成功
                console.log('ServiceWorker registration successful with scope: ', 
                    registration.scope);
            })
            .catch(function (err) {
                // 注册失败:(
                console.log('ServiceWorker registration failed: ', err);
            });
    });
}
每次页面加载成功后，就会调用 register() 方法，浏览器将会判断 service worker 线程是否已注册并做出相应的处理。
scope 参数是可选的，默认值为 sw.js 所在的文件目录。
打开 chrome 浏览器, 输入 chrome://inspect/#service-workers 可以可以用 DevTools 查看 Service workers 的工作情况。
安装
service worker 注册后，浏览器就会尝试安装并激活它，并且在这里完成静态资源的缓存。
所以我们在 sw.js 中添加 install 事件
1
2
3
4
5
6
7
8
9
10
11
12
13
this.addEventListener('install', function (event) {
    event.waitUntil(
        caches.open('my-test-cache-v1').then(function (cache) {
            return cache.addAll([
                '/',
                '/index.html',
                '/main.css',
                '/index.js',
                '/sw-lifecycle.jpg'
            ]);
        })
    );
});
install 事件一般是被用来完成浏览器的离线缓存功能，service worker 的缓存机制是依赖 cache API 实现的。cache API 为绑定在 service worker 上的全局对象，可以用来存储网络响应发来的资源，这些资源只在站点域名内有效，并且一直存在，直到你告诉它不再存储。
缓存和返回请求
每次任何被 service worker 控制的资源被请求到时，都会触发 fetch 事件，因此我们可以利用 fetch 事件对资源响应做一些拦截操作
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
this.addEventListener('fetch', function (event) {
    event.respondWith(
        caches.match(event.request).then(function (response) {
            // 如果 service worker 有自己的返回，就直接返回，减少一次 http 请求
            if (response) {
                return response;
            }
            // 如果 service worker 没有返回，从服务器请求资源
            var request = event.request.clone(); // 把原始请求拷过来
            return fetch(request).then(function (httpRes) {
                // 请求失败了，直接返回失败的结果就好了。。
                if (!httpRes && httpRes.status !== 200) {
                    return response;
                }
                // 请求成功的话，再一次缓存起来。
                var responseClone = httpRes.clone();
                caches.open('my-test-cache-v1').then(function (cache) {
                    cache.put(event.request, responseClone);
                });
                return httpRes;
            });
        })
    );
});
这样看来，其实可以把 service worker 理解为一个浏览器端的代理服务器，这个代理服务器通过 scope 和 fetch 事件来 hook 站点的请求，来达到资源缓存的功能。
注意：request 和 response 不能直接使用而是通过 clone 的方式使用是因为他们是 stream，因此只能使用一次。
install vs fetch
install 的优点是第二次访问即可离线，缺点是需要将需要缓存的资源 URL 在编译时插入到脚本中，增加代码量和降低可维护性；
fetch 的优点是无需更改编译过程，也不会产生额外的流量，缺点是需要多一次访问才能离线可用。
service worker 更新
/sw.js 控制着页面资源和请求的缓存，如果 /sw.js 需要更新应该怎么办呢？
service worker 控制着整个 App 的离线缓存。 为了避免 service worker 缓存自己导致死锁无法升级，通常将 sw.js 本身的缓存直接交给 HTTP 服务器缓存。
更新 sw.js 文件，当浏览器获取到了新的文件，发现 sw.js 文件发生更新，就会安装新的文件并触发 install 事件。
但是此时已经处于激活状态的旧的 service worker 还在运行，新的 service worker 完成安装后会进入 waiting 状态，直到所有已打开的页面都关闭。
新服务工作线程取得控制权后，将会触发其 activate 事件。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
// 安装阶段跳过等待，直接进入 activate
self.addEventListener('install', function (event) {
    event.waitUntil(self.skipWaiting());
});

self.addEventListener('activate', function (evnet) {
    event.waitUntil(
        Promise.all([
            // 更新客户端
            self.clients.claim(),
            // 清理旧版本
            caches.keys().then(function (cacheList) {
                return Promise.all(
                    cacheList.map(function (cacheName) {
                        if (cacheName !== 'my-test-cache-v1') {
                            return caches.delete(cacheName);
                        }
                    })
                );
            })
        ])
    );
});
注意：如果 sw.js 文件被浏览器缓存，则可能导致更新得不到响应。如遇到该问题，可尝试这么做：在 webserver 上添加对该文件的过滤规则，不缓存或设置较短的有效期。
手动更新 /sw.js
也可以借助 Registration.update() 手动更新
1
2
3
4
5
6
7
8
9
var version = '1.0.1';

navigator.serviceWorker.register('/sw.js').then(function (reg) {
    if (localStorage.getItem('sw_version') !== version) {
        reg.update().then(function () {
            localStorage.setItem('sw_version', version)
        });
    }
});
自动更新
除了浏览器触发更新之外，service worker 还有一个特殊的缓存策略： 如果该文件已 24 小时没有更新，当 Update 触发时会强制更新。这意味着最坏情况下 service worker 会每天更新一次。
调试时更新
可以单独设置调试时 service worker 安装后立即激活：
1
2
3
self.addEventListener('install', function() {
    self.skipWaiting();
});
service worker 生命周期
service worker 工作流程
service worker 基于注册、安装、激活等步骤在浏览器 js 主线程中独立分担缓存任务。
首先在页面的 javaScript 主线程中使用 navigator.serviceWorker.register() 来注册 servcie worker。
如果注册成功，service worker 在 ServiceWorkerGlobalScope 环境中运行； 这是一个特殊的 worker context，与主脚本的运行线程相独立，同时也没有访问 DOM 的能力。
后台开始安装步骤，通常在安装的过程中需要缓存一些静态资源。install 事件回调中有两个方法：event.waitUntil()：传入一个 Promise 为参数，等到该 Promise 为 resolve 状态为止。
self.skipWaiting()：self 是当前 context 的 global 变量，执行该方法表示强制当前处在 waiting 状态的 Service Worker 进入 activate 状态。
当 service worker 安装完成后，会接收到一个激活事件（activate event）。激活事件的处理函数中，主要操作是清理旧版本的 service worker 脚本中使用资源。activate 回调中有两个方法：event.waitUntil()：传入一个 Promise 为参数，等到该 Promise 为 resolve 状态为止。
self.clients.claim()：在 activate 事件回调中执行该方法表示取得页面的控制权, 这样之后打开页面都会使用版本更新的缓存。旧的 Service Worker 脚本不再控制着页面，之后会被停止。
激活成功后 service worker 可以控制页面了，刷新页面可以查看 service worker 的工作成果。
service worker 事件
install: service worker 安装成功后被触发的事件，在事件处理函数中可以添加需要缓存的文件。
activate：当 service worker 安装完成后并进入激活状态，会触发 activate 事件。通过监听 activate 事件你可以做一些预处理，如对于旧版本的更新、对于无用缓存的清理等。
message：service worker 通过 postMessage API，可以实现与主线程之间的通信。
下面是一个使用 service worker 的 postMessage API 做的一个简单计算器，其中计算部分在 service worker 线程中完成。假如有一些比较耗时的工作，比如大量计算，或者 fetch 数据，可以将其放入 service worker 线程中，以达到提高页面响应的目的。
在线演示
源码
fetch (请求)：当浏览器在当前指定的 scope 下发起请求时，会触发 fetch 事件，并得到传有 response 参数的回调函数，回调中就可以做各种代理缓存的事情了。
push (推送)：push 事件是为推送准备的。不过首先需要了解一下 Notification API 和 PUSH API。通过 PUSH API，当订阅了推送服务后，可以使用推送方式唤醒 Service Worker 以响应来自系统消息传递服务的消息，即使用户已经关闭了页面。
示例
这个网站记录了很多 service worker demo。
参考文档
lavas
Service Worker API-MDN
服务工作线程
Service Worker 更新机制


hexo 支持 emoji
2017-07-05T16:24:06.000Z
添加方法
很简单，换一个 markdown 引擎，然后再增加 emoji 插件即可。😊
1
2
3
$ npm un hexo-renderer-marked --save
$ npm i hexo-renderer-markdown-it --save 
$ npm install markdown-it-emoji --save
据说 hexo-renderer-markdown-it 的速度要比 Hexo 原装插件要快，而且功能更多：
Main Features
Support for Markdown, GFM and CommonMark
Extensive configuration
Faster than the default renderer | hexo-renderer-marked
Safe ID for headings
Anchors for headings with ID
Footnotes
 H₂O
 x²
 Inserted
然后编辑 _config.yml：
1
2
3
4
5
6
7
markdown:
  plugins:
    - markdown-it-footnote
    - markdown-it-sup
    - markdown-it-sub
    - markdown-it-abbr
    - markdown-it-emoji
使用方法
在 Emoji 中找到你想要的表情，然后点击即可复制。
比如你想发一个笑脸 😄 直接输入笑脸对应的 emoji 编码 :smile: 就可以。


为什么 call 的速度快于 apply
2017-06-29T16:43:04.000Z
在 stackoverflow 看到一个有趣的问题: Why is call so much faster than apply? 于是使用 benchmark.js 在 node 中自己测试了一下：
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
const Benchmark = require('benchmark')
const suite = new Benchmark.Suite
const applyFun = function (str) {
    return [].slice.apply(str, [1])
}
const callFun = function (str) {
    return [].slice.call(str, 1)
}
// add tests
suite.add('apply', function () {
    applyFun('apple')
}).add('call', function () {
    callFun('apple')
}).on('cycle', function (event) {
    console.log(String(event.target))
}).on('complete', function () {
    console.log('Fastest is ' + this.filter('fastest').map('name'))
}).run({'async': true})
测试环境：
系统：macOS Sierra
CPU：2.6 GHz Intel Core i5
内存：8 GB 1600 MHz DDR3
Node: 8.1.0
测试结果：
1
2
3
apply x 951,707 ops/sec ±0.46% (87 runs sampled)
call x 969,699 ops/sec ±0.52% (91 runs sampled)
Fastest is call
可见虽然 call 比 apply 要快一些，但是差别并不是很大，那么在浏览器上面表现如何呢？
你也可以点击下面的 button 在自己的浏览器上查看运行效果。
        call vs apply                            
可以看到几个浏览器中都是 call 的速度要快于 apply，不过都没有特别明显。其中 Safari 的速度让我大吃一惊，直接比其它几个浏览器快了一个数量级。看来 WWDC 2017 发布会上苹果吹的牛没有那么大啊，不过也可能 mac 从硬件层面对 Safari 进行优化。
为什么 call 要快于 apply
SO 上面解释的比较详细，在语言设计的时候，apply 需要执行的步数就比 call 要多：无论 call 还是 apply，最终都是调用一个叫做 [[Call]] 的内部函数，而 apply 相对于 call 多做了一些参数处理，如参数判断、格式化等。
困惑
SO 上面提到 call 的性能是 apply 的 4 倍甚至 30 倍，为什么在我这里的测试只有一丁点差距呢？
突然想到是否参数问题，于是去掉参数和增加参数，分别于 node 环境中测试，发现变化并不大，差距依然很小。那么猜想可能是 ES5 与 ES6 的差距导致的。
对比 ES5 和 ES6 中对这两个函数的定义，发现 Function.prototype.call 的变化并不大，主要变化发生在 Function.prototype.apply 上，从 ES5 的 9 步变成了 ES6 的 6步。主要变化发生在对参数处理的部分，其它关于内部函数调用的部分，看起来并没有太多差异。
总结
通过测试发现随着 ECMAScript 语言和 JavaScript 解释器性能不断增强，call vs apply 在性能上的差距越来越小， SO 上面提到的数倍甚至几十倍的差距，目前已经不存在了，因此在使用上可以随心所欲了。


CSS Modules 学习
2017-06-21T10:39:32.000Z
CSS Modules 的用法很简单，不过现阶段还需要 webpack 的支持。CSS Modules 的功能非常少，它一共就干了两件事：局部作用域和模块依赖。
CSS Modules 示例
代码地址
项目路径
1
2
3
4
5
6
7
8
9
10
11
├── README.md
├── index.html
├── node_modules
│   └── ...
├── package.json
├── src
│   ├── animation.css
│   ├── colors.css
│   ├── index.js
│   └── style.css
└── webpack.config.js
把文件 clone 下来后，安装依赖，然后就可以运行了
1
2
3
4
$ git clone https://github.com/Leo555/css_modules_study.git
$ cd css_modules_study
$ npm install
$ npm run start
浏览器会自动打开静态文件，方便查看效果。
CSS Modules 用法
webpack
首先配置 webpack 环境(本文使用webpack2)，给 css-loader 增加一个 modules 查询参数，表示打开 CSS Modules 功能。
简单的示例如下：
1
2
3
4
5
6
module: {
  rules: [{
    test: /\.css$/,
    loader: "style-loader!css-loader?modules"
  }]
},
如果需要给 CSS Modules 传递一些参数，可以用对象的方式：
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
module: {
  rules: [{
    test: /\.css$/,
    use: ["style-loader", 
    {
      loader: "css-loader",
      options: {
        modules: true,
        localIdentName: '[path][name]__[local]--[hash:base64:5]',
        importLoaders: 1,
        camelCase: true
      }
    }]
  }]
}
作用域
开启 CSS Modules 后，所有的 CSS 选择器都是局部作用域，除非声明它为全局的。
1
2
3
4
5
6
7
8
9
10
/*Scoped Selectors*/
.className {
  color: green;
  margin: 10px 0;
}

/*Global Selectors*/
:global(.text) {
  font-size: 22px;
}
以上两个 CSS class 通过如下方法被 JS 引用
1
2
3
4
5
6
7
8
9
import styles from "./style.css";
// import { className } from "./style.css";

let app = document.getElementById('app')
app.innerHTML = 
`
${styles.className}">Hello CSS Modules
Global Selectors
`
后面的引用方式都相同，因此略去，具体可查看 index.js。
查看构建后的 CSS，发现局部变量的名字被编译成 hash (localIdentName: '[path][name]__[local]--[hash:base64:5]')，而全局变量的名字不变。
原来 CSS Modules 就做了这么一点微小的工作。
class 继承和重写
CSS Modules 通过组合的方式进行集成，以达成代码复用的效果。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
/*Class Composes*/
.otherClassName {
  composes: className;
  width: 220px;
  height: 60px;
  line-height: 60px;
  border-width: 2px;
  border-style: solid;
}

/*Composes Overrides*/
.background {
  border-radius: 20px;
  background: #efefef;
  composes: otherClassName;
  border-style: dotted;
}
otherClassName 继承 className，因为拥有了 color 和 margin 属性，而 background 继承 otherClassName，却重写了 border-style。
局部动画
在 animation.css 中，定义了动画 tada：
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
@keyframes tada {
  from {
    transform: scale3d(1, 1, 1);
  }
  10%, 20% {
    transform: scale3d(.9, .9, .9) rotate3d(0, 0, 1, -3deg);
  }
  30%, 50%, 70%, 90% {
    transform: scale3d(1.1, 1.1, 1.1) rotate3d(0, 0, 1, 3deg);
  }
  40%, 60%, 80% {
    transform: scale3d(1.1, 1.1, 1.1) rotate3d(0, 0, 1, -3deg);
  }
  to {
    transform: scale3d(1, 1, 1);
  }
}

.tada {
  animation: tada 2s infinite;
}
在 style 中的引用方式如下：
1
2
3
4
5
/*Scoped Animations*/
.backgroundAnimation {
  composes: background;
  composes: tada from './animation.css';
}
上面第二个 composes 也展示了如何从其它 CSS 模块中引用选择器。
定义变量
通过 @value 定义变量和引用变量
colors.css
1
2
@value color: black;
@value fontSize: 22px;
引用方式
1
2
3
4
5
6
7
8
9
/*Define variables*/
@value colors: "./colors.css";
@value color, fontSize from colors;

.color {
  composes: otherClassName;
  color: color;
  font-size: fontSize;
}
Vue 结合 CSS Modules
vue-loader 中集成了 CSS Modules，可以作为模拟 CSS 作用域的替代方案。
使用
在   
animation
animation 是复合属性，其子属性有：
(1) animation-delay 动画延时
(2) animation-direction 动画在每次运行完后是反向运行还是重新回到开始位置重复运行
(3) animation-duration 动画一个周期的时长
(4) animation-iteration-count 动画重复次数，infinite无限次重复动画
(5) animation-name 指定由 @keyframes
(6) animation-timing-function 设置动画速度曲线，默认是 “ease”
(7) animation-fill-mode 指定动画执行后跳回到初始状态还是保留在结束状态
此外，还有 animation-play-state 属性，但是不能简写到 animation 属性中，该属性允许暂停和恢复动画。
基本语法
1
2
3
4
5
6
7
8
9
10
animation-name: first_animation;
animation-duration: 5s;
animation-timing-function: linear;
animation-delay: 2s;
animation-iteration-count: infinite;
animation-direction: alternate;
animation-play-state: running;

/* 简写 */
animation: first_animation 5s linear 2s infinite alternate;
animation: name duration timing-function delay iteration-count direction;
@keyframes
@keyframes 用于规定动画如何从一种样式逐渐变化为另一种样式，其基本用法如下：
1
2
3
4
5
6
7
8
9
10
11
12
13
@keyframes first_animation {
  0%   {background: red; left:0px; top:0px;}
  25%  {background: yellow; left:200px; top:0px;}
  50%  {background: blue; left:200px; top:200px;}
  75%  {background: green; left:0px; top:200px;}
  100% {background: red; left:0px; top:0px;}
}

@keyframes first_animation {
  from {background: red;}
  50% { background: orange }
  to {background: yellow;}
}
关键词 “from” 和 “to”，等同于 0% 和 100%，表示动画开始状态和结束状态。中间状态由浏览器自动推算。
animation-iteration-count
animation-iteration-count 指定动画播放的次数，默认值为 1。可以指定具体的次数，也可以使用关键字 infinite 让动画无限次播放。
1
2
3
4
5
animation-name: first_animation;
animation-duration: 5s;
animation-iteration-count: 1;
/* 等同于 */
animation: first_animation 5s infinite;
animation-fill-mode
animation-fill-mode 指定动画执行后跳回到初始状态还是保留在结束状态。
animation-fill-mode : none | forwards | backwards | both;
none: 不改变默认行为
forwards：当动画完成后，保持最后一个属性值(在最后一个关键帧中定义)
backwards：让动画回到第一帧的状态(在第一个关键帧中定义)
both：根据 animation-direction 轮流应用 forwards 和 backwards 规则
animation-direction
animation-direction 指定对象动画运动的方向，有以下四种取值：
normal：正常方向，默认
reverse：动画反向运行,方向始终与normal相反
alternate：动画会循环正反方向交替运动
alternate-reverse：动画从反向开始，再正反方向交替运动
animation-play-state
animation-play-state 用于手动控制动画的状态，有 paused 和 running 两种取值：
running：默认值，表示动画正常运动
paused：表示暂停动画
参考资料
MDN-CSS Animations
CSS3的变形transform、过渡transition、动画animation学习
CSS动画简介


CSS3 动画—transition
2017-06-12T10:21:22.000Z
CSS3 过渡属性被封装在 transition 规范中，过渡的意义在于，给了 CSS 时间轴的概念，在此之前所有的 CSS 状态变化都是瞬间完成的。过渡可以视为简单版的动画，通过定义开始状态和结束状态，达到样式转变的功能。
目前各大浏览器都支持 transition，所以不加浏览器前缀即可使用。
CSS3 transition 规范定义了以下四个 CSS 属性：
transition-delay(过渡延迟时间)
transition-duration(过渡持续时间)
transition-property(过渡属性)
transition-timing-function(过渡效果的时间曲线)
1
2
3
4
5
/* transition: 1s 1s width ease; */
transition-property: width;
transition-duration: 1s;
transition-delay: 1s;
transition-timing-function: ease;
过渡属性 transition-property
默认值为 all，表示浏览器所有能接受的可过渡属性，可以使用单个值或以逗号隔开的多个值。
1
2
3
4
transition-property: width,height;
transition-duration: 1s,2s;
/* transition: 1s width, 2s height; */
/* transition: width 1s, height 2s; */
可以在 这里 和 这里 查看哪些 CSS 属性支持 transition。
延迟时间 transition-delay
transition-delay 属性规定了在执行一个过渡之前的等待时间。IE 和 Opera 不接受 transition-duration 在-10ms和10ms之间的值。默认值0表示不过渡直接看到执行后的结果。单位是秒s，也可以是毫秒ms。
1
2
transition-delay: 1s;
transition-delay: 1000ms;
过渡时间 transition-duration
动画的执行时间，默认值0表示不过渡。单位是秒s，也可以是毫秒ms。
1
2
transition-duration: 1s;
transition-duration: 1000ms;
过渡效果 transition-timing-function
ease：默认值，缓解效果，变化速度逐渐放慢
linear：线性效果，匀速变化
ease-in：渐显效果，加速变化
ease-out：渐隐效果，减速变化
ease-in-out：渐显渐隐效果
cubic-bezier： 自定义变化速度，可以使用 cubic-bezier 定制想要的效果。
1
transition: width cubic-bezier(.14,.78,.92,.36) 1s;
transition
transition 是一个复合属性，可以同时定义
transition-property、transition-duration、transition-timing-function、transition-delay 子属性值。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
/* property name | duration | timing function | delay */
transition: margin-left 4s ease-in-out 1s;

/* property name | duration | delay */
transition: margin-left 4s 1s;

/* property name | duration */
transition: margin-left 4s;

/* Apply to all changed properties */
transition: all 0.5s ease-out;

/* Apply to multiple properties */
transition: width 2s, height 2s, background-color 2s, transform 2s;
写复合属性的时候，四个属性是可以改变顺序的，不过两个时间属性若同时出现，第一个代表 duration，第二个代表 delay，如果只出现一个时间属性，则表示 duration。
transition 结合 transform
使用 transition 结合 transform 能够完成一些简单的动画效果
使用 transition 做动画简单易用，不过也存在一些缺点：
(1) 动画需要事件触发
(2) 动画只能执行一次
(3) transition 只能定义开始状态和结束状态，不能定义中间状态
因此如果想要完成比较复杂的动画，还是要用 css3 中的 animation 属性。
参考资料
CSS动画简介
MDN-Using CSS transitions


CSS3 动画—transform
2017-06-09T16:23:31.000Z
在 CSS3 中，跟动画相关的属性有：变形 transform、过渡 transition、动画 animation。先放一个 Lea Verou 大神的链接 animatable。
本章学习 CSS3 中的 transform 属性。
变形 transform
transform 属性目前还存在浏览器兼容性问题，建议使用 PostCSS 或手动添加浏览器前缀。
使用 transform，元素可以被转换（translate）、旋转（rotate）、缩放（scale）、倾斜（skew）。
transform 属性只对 block 元素生效。
移动 translate
transform: translate(x, y); 表示使元素在 X 轴和 Y 轴移动，y 可以省略，表示不移动。如果参数为负，则表示往相反的方向移动。同时还可以使用 translateX、translateY 和 translateZ 表示在某一个方向移动。Z 轴移动的前提是元素本身或者元素的父元素设定了透视值。
1
2
3
4
transform: translate(12px, 50%);
transform: translateX(2em);
transform: translateY(0.3in);
transform: translateZ(20px);
旋转 rotate
旋转 transform: rotate(angle) angle 取值有：角度值deg，弧度值rad，梯度gard，转/圈turn，正数值代表顺时针旋转，反之逆时针。
rotateX、rotateY、rotateZ 表示分别在 X、Y、Z 轴上旋转。rotate3d(x, y, z, angle) 表示在3维空间旋转。
1
2
3
4
5
6
transform: rotate(-30deg);
transform: rotate(0.5turn);
transform: rotate3d(1, 2.0, 3.0, 10deg);
transform: rotateX(0.5deg);
transform: rotateY(0.5deg);
transform: rotateZ(0.5deg);
缩放 scale
缩放 transform: scale(x, y) 表示使元素在 X 轴和 Y 轴缩放。
1
2
3
4
5
transform: scale(2, 0.5);
transform: scaleX(2);
transform: scaleY(0.5);
transform: scale3d(2.5, 1.2, 0.3);
transform: scaleZ(0.3);
倾斜 skew
倾斜 transform: skew(x, y) 表示 X 轴和 Y 轴倾斜的角度，取值类型为角度值deg。
1
2
3
transform: skew(30deg, 20deg);
transform: skewX(30deg);
transform: skewY(1.07rad);
矩阵变形 matrix
矩阵变形transform: matrix(a,c,e,b,d,f) 相当于直接应用一个[a c e b d f]变换矩阵。
1
transform:  matrix(a, c, b, d, tx, ty)
变形原点 transform-origin
transform-origin 用来定义转换元素的位置，在没有重置 transform-origin 改变元素原点位置的情况下，CSS 的变形操作都是以元素自己中心位置进行。
1
2
3
4
5
transform-origin: left;
transform-origin: left top;
transform-origin: 50% 100%;
transform-origin: 50% bottom;
transform: rotate(30deg);
参考资料
MDN
CSS3的变形transform、过渡transition、动画animation学习


异形：契约
2017-05-16T22:49:25.000Z
今年最期待的电影，没有之一。《异形》系列电影忠实粉丝，不知道看了多少遍。2012年的《普罗米修斯》也是不亚于《异形1》的经典之作，雷德利·斯科特更是越老电影越具有哲思。
下面是 B 站上的一则影评，建议高清食用。



机器学习—通过 APP 预测用户性别
2017-05-16T14:32:51.000Z
项目描述
公司组织的一个机器学习的小比赛， 数据下载地址  。大意是根据用户所安装的 APP (加密)预测用户的性别，训练数据标记 label (性别)，典型的监督学习方案。
数据描述
下载之后，解压成为文本文件。 数据格式如下：
每一行代表一个用户的数据，一共120万个样本用户数据
每一行都有5列，每一列以制表符 tab 分割（\t)。
第一列是用户编号（已经脱敏，转化成1 ~1,200,000的编号)
第二列是用户的性别 （male/female)
第三列是用户的移动设备类型
第四列是用户的 APP 列表，每个 APP 已经脱敏，以数字编号代替 APP 名称。多个 APP 之间以逗号（,)作为分隔符
第五列是用户所在区域。
其中移动设备类型/APP 列表/区域是特征数据。性别是结果数据。
方案
首先分析数据，一共有机型、APP、区域三个维度。性别可能对 APP 和机型有偏好，但是不能对区域有偏好，而是不同的区域可能对 APP 有不同的偏好，比如某省用户偏爱直播，某省用户偏爱交友等等。
建模方案，把 APP 和 机型（数值化）作为两个维度对数据进行训练，分区域建模，不同的区域使用不同的模型。然后使用全部数据或随机部分数据建模形成公共数据模型，公共模型用来分析用户区域数据不足或者来自未建模区域的数据。
具体实现
技术方案：Python + scikit-learn + pandas + numpy
环境搭建使用 Anaconda
 代码地址 
项目难点
项目困难主要出现在 APP 降维，也就是判断哪些 APP 与性别相关，这是一个相关性分析的问题。网上找了很多资料，算法描述也有，不过没有找到合适的 Python 实现。Spark 版本的倒是很多，可是不想在一个小项目里面使用两种技术栈。
进度
目前使用上海数据建模，只使用 APP 信息，未加入机型信息，预测准确度大约为79%。
后面会加入机型信息，并使用特征提取对 APP 信息进行降维，希望能提高准确率。
说明
由于公司政策原因，代码不能放入 github，后续会把思路和核心代码写出来。


再不学 flex 就不会写布局了
2017-04-19T20:35:52.000Z
如何居中的问题
块状元素居中是一个老生常谈的话题，之前面试的时候考官也曾问到过这个。下面写几种常见的块状元素居中的方式。
假如想要 con 在 box 中居中
1
2
3
<div class="box">
  <div class="con">div>
div>
绝对布局，使用 margin
1
2
3
4
5
6
7
8
9
10
11
12
.box {
  width: 500px;
  height: 500px;
  background: #ebebeb;
}
.con {
  width: 100px;
  height: 100px;
  background: #000;
  position: absolute;
  margin: 200px;
}
相对布局，计算 left 和 top
1
2
3
4
5
6
7
8
9
10
11
12
13
.box {
  width: 500px;
  height: 500px;
  background: #ebebeb;
}
.con {
  width: 100px;
  height: 100px;
  background: #000;
  position: relative;
  left: 200px;
  top: 200px;
}
父容器宽高不确定或者不容易确定，综合相对布局 + 绝对布局
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
.box {
    width: 500px;
    height: 500px;
    background: #ebebeb;
    position: relative;
}

.con {
    width: 100px;
    height: 100px;
    background: #000;
    position: absolute;
    top: 50%;
    left: 50%;
    margin-top: -50px;
    margin-left: -50px;
}
使用 flex
1
2
3
4
5
6
7
8
9
10
11
12
13
14
.box {
    width: 500px;
    height: 500px;
    background: #ebebeb;
    display: flex;
    justify-content: center;
    align-items: center;
}

.con {
    width: 100px;
    height: 100px;
    background: #000;
}
flex + margin
1
2
3
4
5
6
7
8
9
10
11
12
13
.box {
    display: flex;
    width: 500px;
    height: 500px;
    background: #ebebeb;
}

.con {
    width: 100px;
    height: 100px;
    background: #000;
    margin: auto;
}
使用 flex 布局的优势不可谓不明显：
免去了很多计算。最后两个使用 flex 布局的例子中，无论父元素还是子元素的宽度和高度发生改变，都能依然能保持居中；而前面三种方法中，则需要都要改变其他值，才能保持居中。
使用 flex 布局的语义化要比前面几种都好，前面三种方法给了一大堆数字，不去认真看一看、算一算，很难确定是否是居中，这对代码阅读者也是非常不友好。
flex 对响应式布局的支持更好。虽然前面几种方法也能实现响应式布局，但是实现起来比较麻烦，不如 flex 来得实在。
flex 支持行内元素。
什么是 flex 布局
传统布局的核心是盒子模型，依赖 display 属性 + position 属性 + float 属性。可以看出来传统布局非常容易实现像 word 左对齐，右对齐这样的功能，可以说，传统布局更适合于文字排版。
flex 是 flexible Box 的缩写，可以看做弹性的盒子模型。
flex 用法
使用 flex 首先要设置父元素 display: flex。任何元素都可以指定为 flex 布局：
块状元素：
1
2
3
.box {
    display: flex;
}
行内元素
1
2
3
.box {
    display: inline-box;
}
设为 flex 布局以后，子元素的 float、clear 和 vertical-align 属性将失效。
flex 两个基本概念
flex 的核心的概念就是 容器 和 轴。容器包括外层的 父容器 和内层的 子容器，轴包括 主轴 和 交叉轴，如下图所示：
容器默认存在两根轴：水平的主轴（main axis）和垂直的交叉轴（cross axis）。主轴的开始位置叫做 main start，结束位置叫做 main end；交叉轴同理，
子容器默认沿主轴排列。单个子容器占据的主轴空间叫做 main size，占据的交叉轴空间叫做 cross size。
容器具有这样的特点：父容器可以统一设置子容器的排列方式，子容器也可以单独设置自身的排列方式，如果两者同时设置，以子容器的设置为准。
父容器
父容器一共有6个属性: flex-direction, flex-wrap, flex-flow, justify-content, align-items, align-content
flex-direction 属性决定主轴的方向
属性 描述 效果
flex-direction: row （默认值）主轴为水平方向，起点在左端 
flex-direction: row-reverse 主轴为水平方向，起点在右端 
flex-direction: column 主轴为垂直方向，起点在上沿 
flex-direction: column-reverse 主轴为垂直方向，起点在下沿 
flex-wrap 决定子容器是否换行排列
属性 描述 效果
flex-wrap: nowrap （默认）不换行 
flex-wrap: wrap 换行，第一行在上方 
flex-wrap: wrap-reverse 换行，第一行在下方 
flex-flow
flex-direction 属性和 flex-wrap 属性的简写形式，默认值为 row nowrap
justify-content 设置子容器在主轴上的对齐方式
属性 描述 效果
justify-content: flex-start （默认）起始端对齐 
justify-content: flex-end 末尾段对齐 
justify-content: center 居中对齐 
justify-content: space-around 子容器沿主轴均匀分布，位于首尾两端的子容器到父容器的距离是子容器间距的一半。 
justify-content: space-between 子容器沿主轴均匀分布，位于首尾两端的子容器与父容器相切。 
align-items 设置子容器沿交叉轴的对齐方式
属性 描述 效果
align-items: flex-start 交叉轴的起点对齐 
align-items: flex-end 交叉轴的终点对齐 
align-items: center 交叉轴的中点对齐 
align-items: baseline 基线对齐（首行文字对齐）所有子容器向基线对齐，交叉轴起点到元素基线距离最大的子容器将会与交叉轴起始端相切以确定基线。 
align-items: stretch （默认）如果子容器未设置高度或设为auto，子容器沿交叉轴方向的尺寸拉伸至与父容器一致 
子容器
子容器一共有6个属性： order, flex-grow, flex-shrink, flex-basis, flex, align-self
order 改变子容器的排列顺序
默认值为 0，可以为负值，数值越小排列越靠前。order 只能为整数。
属性 效果
order: -1 
flex-grow 定义子容器如何瓜分剩余空间
默认值为 0，就是即使存在剩余空间，也不瓜分。如果定义了非 0 值，则按照比例瓜分。flex-grow 只能为整数。
属性 效果
flex-grow: 1 
flex-shrink 定义了子容器的缩小比例。
默认为1，即如果空间不足，则子容器将缩小。如果所有子容器的 flex-shrink 都为1，当空间不足时，都将等比例缩小。如果某个子容器的 flex-shrink 为0，其他子容器都为1，则空间不足时，前者不缩小。
属性 效果
flex-shrink: 0 
flex-basis 用来改变子容器占据主轴空间的大小
表示在不伸缩的情况下子容器占据主轴空间的大小，默认为 auto，表示子容器本来的大小。
flex
flex-grow, flex-shrink 和 flex-basis 的简写，默认值为 0 1 auto
align-self 用来覆盖父容器的 align-items 属性
align-self 属性允许单个子容器有与其他子容器不一样的对齐方式，默认值为auto，表示继承父元素的 align-items 属性，如果没有父元素，则等同于 stretch。改属性的取值与 align-items 相同。
属性 效果
align-self: flex-end 
参考资料
MDN CSS Flexible Box Layout
Flex 布局教程：语法篇


JavaScript 中的作用域和声明提升
2017-04-03T20:19:35.000Z
首先看一个小问题：
1
2
3
4
5
var a = 'Hello';
(function(){
  alert(a)
  var a = 'World'
})()
猜猜弹框中会输出 ‘Hello’ 还是 ‘World’。揭晓答案： ‘undefined’。这里是一个 JavaScript 的小陷阱–JavaScript 变量提升（Hoisting）。
JavaScript Scoping
在 ES6 之前，JavaScript 没有块状作用域（block-level scope），只有函数级作用域（function-level scope）。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
// 块级作用域
var name = 'Leo'
if (name) {
  name = 'Jack' // 这里的 name 是全局变量
  console.log(name) // Jack
}
console.log(name) // Jack
// 函数作用域
var name = 'Leo'
function sayName () {
  var name = 'Jack'
  console.log(name) // Jack    
}
console.log(name) // Leo
如果在声明一个变量的时候没有使用 var 关键字，那么变量将成为一个全局变量。
1
2
3
4
(function() {
  a = 'Hello World'
})()
alert(a) // Hello World
在 setTimeout 中的函数是在全局作用域中执行的。
1
2
3
4
5
6
7
8
9
10
11
12
13
var a = 1
var b = 2

var obj = {
  a: 10,
  b: 20,
  doCalculate: function () {
    setTimeout(function () {
      console.log(this.a + this.b) // 3
    }, 1000)
  }  
}
obj.doCalculate() // 3
为了避免对全局作用域的污染， 所以一般情况下我们尽可能少的声明全局变量。
关于 ES6 中 使用 let 和 const 声明块级作用域的内容，可以参考 JavaScript 中的 let 和 const。
关于 ES5 中严格模式的内容可以参考 JavaScript 严格模式。
关于 JavaScript 中 this 的详细用法可以参考 JavaScript 中 的this。
JavaScript Hoisting
在 JavaScript 中，函数、变量的声明都会被提升（hoisting）到该函数或变量所在的 scope 的顶部。
1
2
3
4
5
6
var a 
console.log(a) // undefined
console.log(b) // undefined
var b
b = a = 10
console.log(a, b) // 10 10
在 JavaScript 中，如果声明一个变量，但是为对其进行赋值，那么 JS 引擎会默认让其等于 undefined。所以上述例子中可以看到变量 b 在声明后，被提升到作用域顶部，和 a 一样，获得了 undefined 的值。
除了变量声明会提升，函数声明也会提升。
1
2
3
4
console.log(add(1, 2, 3)) // 6
function add () {
  return eval(Array.prototype.join.call(arguments, '+'))
}
值得注意的是：函数声明可以提升，但是函数表达式不能提升。
函数声明： function fun(arguments) {}
函数表达式： var fun = function (arguments) {}
1
2
3
4
5
add(1, 2) // 报错：Uncaught TypeError: add is not a function
var add = function () {
  return eval(Array.prototype.join.call(arguments, '+'))  
}
add(1, 2) // 3
函数声明会覆盖变量声明。
1
2
3
4
5
var test 
function test () {
  console.log('test')  
}
console.log(typeof test) // 'function'
如果变量已经赋值，则无法别覆盖：
1
2
3
4
5
var test = 'test'
function test () {}
console.log(typeof test) // 'string'
test = function () {}
console.log(typeof test) // 'function'
优先级
在 JavaScript 中，一个变量以四种方式进入作用域 scope：
语言内置：所有的作用域中都有 this 和 arguments 关键字（global 没有 arguments）;
形式参数：函数的参数在函数作用域中都是有效的;
函数声明：形如 function foo() {};
变量声明：形如 var bar;
函数声明和变量声明总是会被移动（即 hoisting）到它们所在的作用域的顶部。而变量的解析顺序（优先级），与变量进入作用域的 4 种方式的顺序一致，如果一个变量的名字与函数的名字相同，那么函数的名字会覆盖变量的名字，无论其在代码中的顺序如何，但是名字的初始化却是按其在代码中书写的顺序进行的，不受以上优先级的影响。
而变量的解析顺序（优先级），与变量进入作用域的 4 种方式的顺序一致。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
// 1. var 声明并且赋值高于函数声明
var test = 'test'
function test () {}
console.log(typeof test) // 'string'

// 2. 函数声明高于形参
function test (a) {
  console.log(typeof a) // 'function'
  function a () {}
}
test(100)

// 3. 形参高于语言内置变量
function test (arguments) {
  alert(arguments)
}
test(100) // 100
/*--对比以下--*/
function test1 (a) {
  alert(arguments) // [object Arguments]
}
test1(100)

// 4. 形参优先级高于 var 声明不赋值
function test(){
  alert(arguments)
  var arguments
}
test() // [Object Arguments]
变量声明（赋值） > 形参 > 语言内置变量 > 变量声明不赋值 > 函数外部作用域的其他所有声明
总结变量优先级正好验证了作用域链式查找，局部作用域 -> 上一级局部作用域 -> 全局作用域 -> TypeError。
最后看一个例子：
1
2
3
4
5
6
7
function test(arguments) {
  alert(typeof arguments) // 'function'
  var arguments = 20
  function arguments () {}
  alert(arguments) // 20
}
test(100)
参考文章
javascript变量声明优先级
深入理解JS中声明提升、作用域（链）和 this 关键字


PostCSS 初识
2017-03-29T18:20:33.000Z
背景
今天在吃早饭的时候就被同事@，说有一块页面效果在测试服务器的部署效果跟本地不一样：代码在本地运行没有问题，部署后发现有一个分割线的位置明显不对。来到公司后看了同事的演示，觉得可能是 css 代码压缩时出现了问题。
通过 chrome 查看相关 css，发现了问题所在，有一段代码是这样写的：
1
2
3
4
5
6
7
8
9
.clz_editor_container {
  display: -moz-box;
  display: -webkit-flex;
  display: -ms-flexbox;
  -webkit-box-orient: vertical;
  -webkit-flex-direction: column;
  -ms-flex-direction: column;
  height: 100%;
}
压缩后在 chrome 中代码变成了这样的：
1
2
3
4
5
.clz_editor_container[data-v-5fd4dedf]{
  display: -ms-flexbox;
  -ms-flex-direction: column;
  height: 100%;
}
然而实际浏览器中前两句都没有生效。
因为在代码压缩时，相同的代码会默认选择比较靠后的，因此 display: -ms-flexbox; -ms-flex-direction: column;，而 -ms-flexbox 和 -ms-flex-direction 是为了兼容 IE 浏览器而存在的， 所以这两句 css 都没有生效。
而没有压缩的代码在浏览器中运行时，浏览器自动选择了合适的 css 语句所以没有出现问题。
解决方案很简单啦，这应该是同事写代码粗心导致的，直接把 display: flex; flex-direction: column;加上就行了。而且 idea 里面自动代码兼容性补全功能，所以用 idea 写出的代码应该不会出现这个问题。
然后有同事说应该有一些工具能够自动补全的，于是 google 了一下，发现这种问题早就有非常好的解决方案，那就是 PostCSS 的插件 autoprefixer。
解决方案
首先安装 webpack 插件 postcss-loader 和 autoprefixer
1
$ npm i autoprefixer postcss-loader --save-dev
然后修改 webpack 配置文件，在插件系统中更改 LoaderOptionsPlugin，在 options 中增加 postcss
1
2
3
4
5
6
new webpack.LoaderOptionsPlugin({
    minimize: process.env.NODE_ENV === 'production',
    options: {
        postcss:[autoprefixer()]
    }
})
然后在所有 css 相关的 loader 中增加 postcss-loader
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
{
    test: /\.vue$/,
    loader: 'vue-loader',
    options: {
        loaders: {
            js: '...',
            css: ExtractTextPlugin.extract({
                use: 'css-loader!postcss-loader',
                fallback: 'vue-style-loader'
            }),
            less: ExtractTextPlugin.extract({
                fallback: 'vue-style-loader',
                use: 'css-loader!postcss-loader!less-loader'
            })
        }
    }
},
{
    test: /\.css$/,
    loader: ExtractTextPlugin.extract({
        fallback: 'style-loader',
        use: 'css-loader!postcss-loader'
    })
},
{
    test: /\.less$/,
    loader: ExtractTextPlugin.extract({
        fallback: 'style-loader',
        use: 'css-loader!postcss-loader!less-loader'
    })
}
注意 postcss-loader 应该放在 less-loader 和 css-loader 之间，处理顺序为:
less-loader -> postcss-loader -> css-loader -> style-loader
修改前面出问题的 css 为原生
1
2
3
4
5
.clz_editor_container {
    display: flex;
    flex-direction: column;
    height: 100%;
}
重新打包压缩后的 css 如下
重新打开查看效果，问题解决。
注意如果你在 css 中使用 @import 引入其它 css 文件，而被引入的文件在 webpack 打包后又没有加入浏览器前缀的话，建议在 css-loader 中加入 importLoaders=1 参数
1
2
3
4
5
6
7
{
    test: /\.css$/,
    loader: ExtractTextPlugin.extract({
        fallback: 'style-loader',
        use: 'css-loader?importLoaders=1!postcss-loader'
    })
}
PostCSS
PostCSS 是什么？官方给出的定义是： PostCSS 是一个用 JavaScript 转化 CSS 的工具。准确的说，PostCSS 是一个平台，通过一些插件，能做很多事情：
（1） 增加代码可读性
比如刚才我们用的 autoprefixer，通过给 css 添加供应商前缀，让我们的 css 代码更加优雅。
（2） 使用未来 CSS 的语法特性
通过使用 cssnext 插件，可以允许我们使用最新的 css 语法，而不用等待浏览器支持。
（3）global css 终结者
PostCSS 通过 CSS Modules 对 css 命名做模块化处理，一般为添加前缀和后缀，让我们写 css 的时候不必担心命名太通用，只要觉得有意义即可。
（4）避免 css errors
通过使用 stylelint 来避免 css errors。
（4）更强大的栅格系统
LostGrid 通过 calc() 轻松创建强大的栅格系统。
（5）更多插件 更多功能
PostCSS webpack
在 webpack 中使用 PostCSS 的一般方式
安装相关依赖
1
$ npm install postcss-loader --save-dev
创建 postcss.config.js
1
2
3
4
5
6
7
module.exports = {
  plugins: [
    require('postcss-smart-import')({ /* ...options */ }),
    require('precss')({ /* ...options */ }),
    require('autoprefixer')({ /* ...options */ })
  ]
}
可以通过在不同路径下创建不同的 config 来实现配置覆盖的功能，在根目录下创建的 postcss.config.js 会被子目录中的配置文件覆盖。
添加 PostCSS Loader 到 webpack.config.js 中，记得要把它放在 css-loader 和 style-loader 后面，如果有其它 loader，如 sass-loader 或者 less-loader， 要放在它们前面。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
module.exports = {
  module: {
    rules: [
      {
        test: /\.css$/,
        use: [
          'style-loader',
          {
            loader: 'css-loader',
            options: {
              importLoaders: 1
            }
          },
          'postcss-loader'
        ]
      }
    ]
  }
}
如果不想使用 postcss.config.js 的话，也可以把插件直接写入到 webpack.config.js 中
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
module.exports = {
module.exports = {
  module: {
    rules: [{
      test: /\.css/,
      use: […{
        loader: 'postcss-loader',
        options: {
          plugins: function() {
            return [
              require('precss'),
              require('autoprefixer')
            ];
          }
        }
      }]
    }]
  }
}
demo
假如有 style.css 如下
1
2
3
4
5
6
7
8
9
10
11
12
:root {
 --base-color: gray;
}

div {
  display: flex;
    border-radius: 10px;
    transition: all 0.8s;
    width: 100px;
    height: 50px;
    background: var(--base-color);
}
webpack 配置文件下
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
var cssnext = require('cssnext');
var autoprefixer = require('autoprefixer');
var px2rem = require('postcss-px2rem');
var Ex = require('extract-text-webpack-plugin');
var webpack = require('webpack')

module.exports = {
  entry: './src/style.css',
  output: {
    filename: "./dist/[name].css"
  },
  module: {
    loaders: [{
      test: /\.css$/,
      loader: Ex.extract({
        fallback: 'style-loader',
        use: 'css-loader!postcss-loader'
      })
    }]
  },
  plugins: [
    new Ex({
      filename: './dist/style.css'
    }),
    new webpack.LoaderOptionsPlugin({
      options: {
        postcss: [autoprefixer({browsers: ['last 2 versions']}), 
          cssnext(), px2rem({remUnit: 100})]
      }
    })
  ]
}
运行 webpack 命令后，dist 文件夹下面的 style.css 如下
1
2
3
4
5
6
7
8
9
10
11
div {
  display: -webkit-box;
  display: -ms-flexbox;
  display: flex;
  border-radius: 0.1rem;
  -webkit-transition: all 0.8s;
  transition: all 0.8s;
  width: 1rem;
  height: 0.5rem;
  background: gray;
}
这里一共使用了三个插件，cssnext 解析 css 自定义属性和 val() 函数，autoprefixer 添加浏览器前缀，postcss-px2rem 完成 px 到 rem 单位的转化。
参考资料
参考 PostCSS 官方网站，了解 PostCSS 的更多内容。
autoprefixer
cssnext


webpack 从入门到放弃
2017-03-11T18:06:04.000Z
简介
Webpack + ES6 已经成为目前最流行的前端解决方案，本文是 Webpack2 学习教程。
在 「What is webpack」一文中作者讲述了自己为什么要开发出 webpack。
切分代码依赖树到不同的代码块，按需加载
保持更少的初始化加载时间
把任何静态资源都视为模块
把任何第三方类库也当作模块
在模块打包中每一部分都允许自定义
更加适合大型项目
使用
安装
新建 webpack-demo 文件夹，安装 webpack 到 dev
1
2
3
$ mkdir webpack-demo
$ npm init -y
$ npm i webpack --save-dev
命令行打包
新建一个 hello.js 文件
1
2
3
4
function hello () {
    alert('Hello webpack')
}
hello()
在命令行中输入下面内容进行打包
1
$ webpack hello.js hello.bundle.js
打开打包后的文件发现里面注入了很多 webpack 所需的一些内置函数，比如 __webpack_require__，除此之外，webpack 还对我们写的代码进行编号，比如刚才我们写的 hello function 在 hello.bundle.js 中的编号就是  /* 0 */。
引入css文件
新建 style.css 文件
1
2
3
body {
    background-color: gray;
}
在 hello.js 中引入该文件
1
require('./style.css')
再次使用刚才的命令打包，发现命令行报错
1
2
3
4
5
6
ERROR in ./style.css
Module parse failed: D:\webpack-demo\style.css Unexpected token (1:11)
You may need an appropriate loader to handle this file type.
| html, body {
|       background-color: gray;
 @ ./hello.js 2:0-22
错误提示很明显：模块解析错误，你可能需要一个合适的 loader 去处理这种类型的文件。
webpack 默认不支持 css 文件类型，所以我们来安装 css-loader 和 style-loader
1
$ npm i css-loader style-loader --save-dev
css-loader 是使 webpack 可以处理 css 文件；style-loader 把 css-loader 处理完的代码，新建一个 style 标签，插入到 HTML 代码中。
然后将这两个 loader 引入 hello.js
1
require('style-loader!css-loader!./style.css')
再次运行打包命令就可以在 hello.bundle.js 中找到下面这句话
1
exports.push([module.i, "body {\r\n\tbackground-color: gray;\r\n}", ""]);
为了查看效果，我们新建 index.html
1
2
3
4
5
6
7
8
9
10
html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <title>webpack demotitle>
head>
<body>
    <script src="./hello.bundle.js">script>
body>
html>
打开 index.html 查看效果，发现 style-loader 在 head 中插入了一个 style 标签将 css 插入 html 中。
webpack 配置文件
在命令行中输入 webpack 命令，webpack 会自动寻找 webpack.config.js 文件，并按照里面的配置对项目进行打包。还可以通过 --config 参数指定 webpack 配置文件。
webpack.config.js 使用 CommonJS 规范，下面是一个最基础的配置文件
1
2
3
4
5
6
7
module.exports = {
  entry: './src/script/main.js',
  output: {
    path: './dist/js',
    filename: 'bundle.js'
  }
}
entry 参数表明我们的打包是从哪个文件开始的，output 参数定义打包后的文件如何存储。
如果需要使用一些 webpack 的参数，可以使用 npm 脚本来实现，比如
1
2
3
"scripts": {
    "webpack": "webpack --display-modules --sort-modules-by size"
}
上面是我们分析 webpack 打包后文件常用的方式，把每个 modules 显示出来，并且按照文件大小排序。
webpack 几个重要概念
entry
webpack 根据 entry 创建所有应用程序依赖图表，entry 告诉 webpack 从哪里开始，并遵循着依赖关系图打包。
entry 有以下几种写法
1
2
3
4
5
6
7
8
9
10
11
12
13
14
entry: './src/app.js'
entry: ['./src/app.js', './src/vendors.js']
entry: {
    main: './src/app.js'
}
entry: {
    app: './src/app.js',
    vendors: './src/vendors.js'
}
entry: {
    pageOne: './src/pageOne/index.js',
    pageTwo: './src/pageTwo/index.js',
    pageThree: './src/pageThree/index.js'
}
指定多入口主要为了解决两种场景，一个是将业务代码和框架代码分割，一个是为了处理多页面应用。使用 CommonsChunkPlugin 插件可以将公共的类库代码打包成一个 common 模块。这样在多页面程序中可以把共用代码缓存起来，方便其他页面使用。
output
output 参数告诉 webpack 如何把编译后的文件写入到磁盘里，无论有多少个 entry 都只有一个 output 配置。一般形式的写法如下：
1
2
3
4
output: {
    filename: 'bundle.js',
    path: __dirname + '/build'
}
output.path 是一个绝对路径，filename 指生产打包文件后的名称
假如 entry 为多入口，使用上述写法只会生产一个 bundle.js，不符合我们代码分割的需求，那么我们可以用一些占位符来表示输出的结果。一共有四种占位符：[id], [name], [hash], [chunkhash]。注意 [hash] 指的是本次打包的 hash，这个 hash 在 webpack 打包时日志的第一行显示。而 [chunkhash] 是每一个 chunk 自己的 hash 值。
1
2
3
4
5
6
7
8
entry: {
    app: './src/app.js',
    search: './src/search.js'
},
output: {
    filename: '[name]-[chunkhash].js',
    path: __dirname + '/build'
}
hash 值由 md5 算法生成，可以当做每个文件的版本号，这点对于我们管理产品时每次只上线被更改的文件非常有用。如果觉得默认 hash 值太长了，可以通过 [chunkhash:8] 来指定 hash 位数。
通常我们上线产品会使用 cdn 加速静态资源文件的获取，我们可以把 cdn 写入到 output.publicPath 中。publicPath 表示如果产品上线，js 的路径就会自动加上 publicPath。
1
2
3
4
5
output: {
    filename: '[name]-[chunkhash].js',
    path: __dirname + '/build',
    publicPath: 'http://cdn.example.com/'
}
loaders
webpack 中把所有的资源都当做一个模块，无论这个文件是代码文件，还是图片文件，只要有对应的 loader 均可以在 webpack 中转换使用，这也是 webpack 最大的优势所在。
前面「引入css文件」中已经展示了如何使用 loader，通常配置方式如下：
1
2
3
4
5
6
7
8
module: {
    rules: [
        {
            test: /\.(js|jsx)$/,
            use: 'babel-loader'
        }
    ]
}
test 说明了当前 loader 能处理那些类型的文件的正则匹配，use 则指定了 loader 的类型。
注：这里说一下 webpack1 与 webpack2 的区别，在 webpack1 中，使用 module.loaders 声明 loader，而 webpack2 中使用功能更为强大的 module.rules。 为了兼容旧版，module.loaders 语法仍然有效，旧的属性名依然可以被解析。
loader 还可以在使用的时候传入相关的参数，比如我们使用 css-loader 时
1
2
3
4
5
6
7
8
9
10
11
12
13
14
module: {
    rules: [{
        test: /\.css$/,
        use: [
            'style-loader', 
            {
                loader: 'css-loader',
                options: {
                    importLoaders: 1
                }
            }
        ]
    }]
}
注：在 webpack 1 中，loader 可以链式调用，上一个 loader 的输出被作为输入传给下一个 loader，通常被用 ! 连写，如 loader: "style-loader!css-loader!less-loader"。这一写法在 webpack 2 中只在使用旧的选项 module.loaders 时才有效。使用 rule.use 配置选项，use 可以设置为一个 loader 数组。使用 module.rules 时，如果只有一个 loader，既可以用 loader 又可以用 use，但是如果是多 loader，则只能使用 use。
处理 ES6 语法
首先安装 babel
1
$ npm install babel-loader babel-core --save-dev
修改 webpack 配置文件
1
2
3
4
5
6
7
8
module: {
    rules: [{
        test: /\.js$/,
        exclude: path.resolve(__dirname, 'node_modules/'),
        include: path.resolve(__dirname, 'src/'),
        loader: "babel-loader"
    }]
}
注意这里一定要加上 exclude 或者 include，因为 babel-loader 处理的速度非常慢。
然后还需要指定所用 ECMAScript 的版本，假如使用 ES6 语法
1
$ npm install babel-preset-es2015 --save-dev
告诉 webpack babel 使用哪个版本的 preset 有三种方式
(1) 在 webpack 中声明
1
2
3
4
5
6
7
8
9
10
module: {
    rules: [{
        test: /\.js$/,
        exclude: /node_modules/,
        loader: "babel-loader",
        query: {
            presets: ["es2015"]
        }
    }]
}
注： 如果 loader 需要传参数的话，既可以写成 query 的形式，也可以写成像 url 传参一样的形式：
1
2
3
4
5
rules: [{
    test: /\.js$/,
    exclude: /node_modules/,
    loader: "babel-loader?presets=es2015"
}]
但是如果为多 loader 的话，只能用 use + options 的形式。
(2) 在根目录创建 .babelrc 文件，文件内容如下
1
2
3
{
  "presets": ["es2015"]
}
(3) 在 package.json 中指定 preset
1
2
3
"babel": {
  "presets": ["es2015"]
}
plugins
插件是 wepback 的支柱功能。在你使用 webpack 配置时，webpack 自身也构建于同样的插件系统上！插件目的在于解决 loader 无法实现的其他事，在这个页面你可以看到一些 webpack 常用的插件。
由于 plugin 可以传递参数，你必须在 wepback 配置中，向 plugins 属性传入 new 实例。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
const HtmlWebpackPlugin = require('html-webpack-plugin'); //通过 npm 安装
const webpack = require('webpack'); //访问内置的插件
const path = require('path');

const config = {
  entry: './path/to/my/entry/file.js',
  output: {
    filename: 'my-first-webpack.bundle.js',
    path: path.resolve(__dirname, 'dist')
  },
  module: {
    loaders: [
      {
        test: /\.(js|jsx)$/,
        loader: 'babel-loader'
      }
    ]
  },
  plugins: [
    new webpack.optimize.UglifyJsPlugin(),
    new HtmlWebpackPlugin({template: './src/index.html'})
  ]
};

module.exports = config;
html-webpack-plugin 使用
下面我们以最常用的 html-webpack-plugin 为例，讲解插件的用法。
首先使用 npm 安装插件
1
$ npm i html-webpack-plugin --save-dev
然后在 webpack.config.js 配置文件中使用。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
const htmlWebpackPlugin = require('html-webpack-plugin')
module.exports = {
    entry: {
        app: './src/script/main.js'
    },
    output: {
        filename: '[name]-[chunkhash:8].js',
        path: __dirname + '/build'
    },
    plugins: [
        new htmlWebpackPlugin({
            filename: 'index-[hash].html',
            template: 'index.html'
        })
    ]
}
html-webpack-plugin 插件还能接受一些其它参数，比如title、inject: (true | 'head' | 'body' | false)、favicon、minify、hash、cache等。
还可以设置一些自定义的参数，在 html 文件中通过类似 js 模板语言的方式进行引用。
比如在 webpack 配置文件中
1
2
3
4
5
6
plugins: [
    new htmlWebpackPlugin({
        template: 'index.html',
        date: new Date()
    })
]
然后在 index.html 中使用 <%= htmlWebpackPlugin.options.date %> 对 date 进行引用，这样就给了我们更大的自由度，用相同的 html 模板生成不同的 html 文件。
通过加上 minify 来实现对 html 文件的压缩，minify 传入一个 html-minify 对象。
1
2
3
4
5
6
7
8
9
10
plugins: [
    new htmlWebpackPlugin({
        template: 'index.html',
        minify: {
            removeComments: true,
            collapseInlineTagWhitespace: true,
            collapseWhitespace: true
        }
    })
]
对于一个多页面应用程序，需要生成多少个页面，就 new 多少个 htmlWebpackPlugin 实例。假如不同的页面依赖不同的 chunks， 那么我们可以使用 chunks 参数指定当前页面所使用的 chunks。也可以使用 excludeChunks 来指定排除了某些 chunks 以后的全部 chunks。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
const htmlWebpackPlugin = require('html-webpack-plugin')

module.exports = {
    entry: {
        a: './src/script/a.js',
        b: './src/script/b.js',
        c: './src/script/c.js'
    },
    output: {
        filename: 'js/[name]-[chunkhash:8].js',
        path: __dirname + '/build'
    },
    plugins: [
        new htmlWebpackPlugin({
            filename: 'a.html',
            template: 'index.html',
            title: 'page a',
            chunks: ['a']
        }),
        new htmlWebpackPlugin({
            filename: 'b.html',
            template: 'index.html',
            title: 'page b',
            chunks: ['b']
        }),
        new htmlWebpackPlugin({
            filename: 'c.html',
            template: 'index.html',
            title: 'page c',
            chunks: ['c']
        })
    ]
}
对应的 html 模板文件为：
1
2
3
4
5
6
7
8
9
html>
<html lang="en">
<head>
    <meta charset="UTF-8">
    <title><%= htmlWebpackPlugin.options.title %>title>
head>
<body>
body>
html>
运行npm run webpack后生成 3 个 html 文件，分别引入其所需要的依赖。
webpack 处理资源文件
样式文件 less/sass
假如有这么一段 less
1
2
3
4
5
6
7
8
9
10
.layer {
    width: 600px;
    height: 200px;
    background-color: green;
    > div {
        width: 400px;
        height: 200px;
        background: gray;
    }
}
首先安装 less 和 less-loader
1
$ npm install less less-loader --save-dev
在 webpack 配置文件中加入 less-loader
1
2
3
4
5
6
7
8
9
10
11
module: {
    rules: [
    {
        test: /\.less$/,
        use: [
            "style-loader",
            "css-loader",
            "less-loader"
       ]
    }]
},
loader 的执行顺序为从后往前执行，所以其顺序为 less-loader -> css-loader -> style-loader。 如果需要引入 postcss-loader 的话，应该放在 less-loader 和 css-loader 中间。
图片文件
图片文件一般使用 file-loader 配合 url-loader，如果有压缩需求的话，可以使用 image-webpack-loader
安装两个 loader
1
$ npm i file-loader url-loader --save-dev
url-loader 的功能与 file-loader 十分相似，不同的是 url-loader 可以指定一个 limit 参数， 当图片或者文件的大小大于 limit 的时候，url-loader 把资源直接交给 file-loader 处理，而当资源小于 limit 的时候，url-loader 会把图片转为 base64 的编码，并直接打包到引用的文件中。
file-loader 打包的文件通过 http 请求获取，url-loader 打包的文件通过 base64 的方式获取，这两个方法各有各的优势。通过 http 载入的图片可以享受到浏览器的图片缓存，当图片重复使用次数比较多的时候具有一定的便利。base64 的方式引入图片可以降低 http 请求的次数，但是也会带来一定程度的代码冗余。
(1) 使用 file-loader
1
2
3
4
5
6
module: {
    rules: [{
        test: /\.(ico|jpe?g|png|svg|gif)$/i,
        loader: 'file-loader'
    }]
}
(2) 使用 url-loader
1
2
3
4
5
6
7
8
9
10
module: {
    rules: [{
        test: /\.(ico|jpe?g|png|svg|gif)$/i,
        loader: 'url-loader',
        query: {
            limit: 10000,
            name: 'assets/[name]-[hash].[ext]'
        }
    }]
}
(3) image-webpack-loader 可以对图片文件进行压缩，并且配合 url-loader 和 file-loader 共同使用
1
2
3
4
5
6
7
8
9
module: {
    rules: [{
        test: /\.(ico|jpe?g|png|svg|gif)$/i,
        use: [
            'url-loader?limit=10000&name=assets/[name]-[hash].[ext]',
            'image-webpack-loader?options={}'
        ]
    }]
}
loader 的参数也可以通过 options 传递
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
{
test: /\.(ico|jpe?g|png|svg|gif)$/i,
use: [
    {
        loader: 'url-loader',
        options: {
            limit: 10000,
            name: 'assets/[name]-[hash].[ext]'
        }
    },
    {
        loader: 'image-webpack-loader',
        options: {}
    }]
}
image-webpack-loader 可以针对不同的图片类型就行压缩，详细的信息可以在官网里面查询。
注：在 image-webpack-loader 实际使用过程中，必须传入一个 options 参数，否则会报错，使用的时候注意一下。
ERROR in   Error: Child compilation failed:
Module build failed: TypeError: Cannot read property ‘bypassOnDebug’ of null
总结
本文只是 webpack 打包的一些知识，只涉及到一些基本使用，关于 webpack 在项目中的实际应用，以及打包的一些技巧和优化，会在下一节中讲起。


CSS 中的各种单位
2017-02-23T14:15:49.000Z
之前遇到 css 中需要使用单位的情况，都草草用 px 或者百分比糊弄过去，导致当需要做一个响应式的页面的时候，要重新补一下 css 单位的技术债。
px
px 是 css 中最常用的字体大小单位。
px 就是表示 pixel，像素，是屏幕上显示数据的最基本的点；还有一个看起来很像的单位 pt，pt 就是 point，是印刷行业常用单位，等于1/72英寸，一般在打印的时候使用。
像素 px 是相对于显示器屏幕分辨率而言的，所以一般把它看做一个基础单位，很多其它单位都是以 px 为参照的。
em rem
em 指的是相对于当前对象内文本的字体大小，比如设置 body 的字体大小(font-size)为 14px，而对 body 内所有的 div 设置字体大小为 1.5em，那么 div 内字体大小就是 14px * 1.5 = 21px
通常写 html 的时候会发生很多嵌套，每个节点都从父节点继承字体大小，这样很难控制每个层级的字体大小。rem (roo em) 应运而生，rem 是指相对于根节点字体大小，通常根节点是指 html 元素。
1
2
html { font-size: 14px; } 
div { font-size: 1.5rem; }
这样所有 div 中字体的大小都是 21px 了。
百分比
css 中的百分比是一种相对值，使用百分比的关键是找到它的参照物。
属性 参照
width & height 宽和高在使用百分比值时，其参照一般都是父元素的 content 的宽和高。
margin & padding margin 和 padding，其任意方向的百分比值，参照都是包含块的宽度。
border-radius 为一个元素的border-radius定义的百分比值，参照物是这个元素自身的尺寸。border-radius:50%;
font-size 参照是直接父元素的 font-size。
line-height 参照是元素自身的font-size
vertical-align 参照是元素自身的line-height
bottom、left、right、top 参照是元素的包含块。left和right是参照包含块的宽度，bottom和top是参照包含块的高度。
transform: translate 参照是元素自己的边界框的尺寸
vh vm
移动互联网时代各种设备大小不一，响应式的布局变得更加流行，而响应式布局很大程度上依赖比例规则。
vh 和 vm 也是相对长度，不过其参照是显示窗口的宽度或高度，一般来说 100 vh = viewport 的高度，100vm = viewport 的宽度。
下面一段话是响应式的，你可以缩放浏览器大小来查看效果。
缩放浏览器大小来查看效果
vmin 和 vmax
vmin 和 vmax 的出现主要是为了移动设备横竖屏切换。vmax 是相对于 viewport 宽度或者高度中比较大的一个，vmin 则是比较小的那个。比如手机屏幕宽度为1100px，高度为700px，那么 100vmin = 700px, 100vmax = 1100px。


vue2.0 组件通信
2017-02-17T10:46:29.000Z
Vue 采用基于组件的开发方式，那么组件之间的通信必不可少：比如父组件要给子组件传递数据，子组件将它内部发生的事情告知给父组件，因此定义一个良好的接口尽可能将组件解耦显得尤为重要，这保证不同的组件可以在相对独立的环境中开发测试，而且更方便阅读理解以及组件复用。
Vue 父子组件之间通信主要采取两种方式，通常可以总结为 props down、events up，父组件通过 props 向下传递数据给子组件，子组件通过 events 给父组件发送消息，这点跟 React 一模一样。
Vue2.0 废除了 events、$dispatch、$broadcast 几个事件，官方推荐使用 全局事件驱动 或者 vuex代替，目前只剩下 vm.$on、vm.$once、vm.$off、vm.$emit 几个事件。
props down
Vue 组件之间的作用域是相互隔离的，父组件向子组件传值只能通过 props 的方式，子组件不能直接调用父组件的数据。在子组件中，如果需要调用父组件传来的参数，必须显式的声明 props。
1
2
3
4
Vue.component('child', {
  props: ['message'],
  template: '{{ message }}'
})
父组件向子组件传值
1
<child message="hello!">child>
单向数据流
props 传递值只能父组件向子组件传递，不能反回来，每当父组件更新时，子组件中的 props 会自动更新。如果在子组件中更改 props，Vue 控制台会给出 warning。因此如果需要在子组件中更改 props 通常会把其作为初始值赋值给某个变量，然后变量的值，或者在计算属性中定义一个基于 props 的值。
events up
如果子组件需要把信息传达给父组件，可以使用 v-on 绑定自定义事件
1
2
3
4
5
<div id="counter-event-example">
  <p>{{ total }}p>
  <button-counter v-on:increment="incrementTotal">button-counter>
  <button-counter v-on:increment="incrementTotal">button-counter>
div>
我们给 button-counter 绑定了一个自定义事件 increment，v-on 绑定事件还可以简写为 @increment=""。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Vue.component('button-counter', {
  template: '',
  data: function () {
    return {
      counter: 0
    }
  },
  methods: {
    increment() {
      this.counter += 1
      this.$emit('increment')
    }
  },
})
new Vue({
  el: '#counter-event-example',
  data: {
    total: 0
  },
  methods: {
    incrementTotal() {
      this.total += 1
    }
  }
})
button-counter 组件的模板中包含一个 button，其 click 事件会触发($emit)自定义事件 increment，因此每次在子组件中点击一次 button，父组件中都会调用 incrementTotal() 方法。
非父子组件通信
上面讲的两种方法都父子组件之间的通信，有时候非父子关系的组件也需要通信。在 Vue1.0 时代，可以通过 $dispatch 和 $broadcast 来解决，首先 dispatch 到根组件，然后再 broadcast 到子组件。Vue2.0 中官方推荐用 event bus 或者 vuex 解决，event bus 的本质是一个发布者订阅者模式。
使用一个空的 Vue 实例作为中央事件总线
var bus = new Vue()
触发组件 A 中的事件(发布消息)
bus.$emit('id-selected', 1)
在组件 B 创建的钩子中监听事件（订阅消息）
bus.$on('id-selected', function (id) {})
下面是 stackoverflow 上面的一个例子
1
2
3
4
<div id="example">
    <Display>Display>
    <Increment>Increment>
div>
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
var bus = new Vue()

Vue.component('Increment', {
  template: ``,
  data: function() {
   return {count: 1}
  },
  methods: {
    increment: function(){
      var increment = this.count++
      bus.$emit('inc', increment)
  }
 }
})

Vue.component('Display', {
  template: `Clicked: {{count}} times
`,
  data: function(){
  return {count: 0}
  },
 created: function(){
   bus.$on('inc', function(num){
     this.count = num
   }.bind(this))
 }
})

new Vue({
 el: "#example",
})
全局状态管理 Vuex
Vuex 是 Vue 组件的一个状态管理器，相当于一个只为 Vue 服务的 Redux。下面一个图能很好的反映出 Vuex 是如何让组件之间通信的。
下面是 Vuex 官网上给出的一个 计数器的例子
1
2
3
4
5
6
7
<div id="app">
  <p>{{ count }}p>
  <p>
    <button @click="increment">+button>
    <button @click="decrement">-button>
  p>
div>
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
const store = new Vuex.Store({
  state: {
    count: 0
  },
  mutations: {
    increment: state => state.count++,
    decrement: state => state.count--
  }
})

const app = new Vue({
  el: '#app',
  computed: {
    count() {
      return store.state.count
    }
  },
  methods: {
    increment() {
      store.commit('increment')
    },
    decrement() {
      store.commit('decrement')
    }
  }
})
点击查看效果
  {{ count }}
            
在 Vuex 中，store 是组件状态的一个容器，上面的 store 中定义了一个初始的 state 对象，和两个 mutations 函数。我们可以通过 store.state 来获取状态对象，以及通过 store.commit 方法触发状态变更。要注意的是，我们不能直接更改 store 中的状态，改变 store 中的状态的唯一途径就是显式地提交(commit) mutations。
总结
父组件向子组件传递信息使用 props down
子组件向父组件传递信息使用 event up
其它关系类型组件通信使用 global event bus
大型 SPA 组件之间通信使用 Vuex 管理组件状态
如果想要在 vue2 中使用 dispatch 和 broadcast，可以参考 vue2 组件通信——使用 dispatch 和 broadcast


跳槽小记
2017-02-15T13:26:28.000Z
面试经历
一共去金山面了三次试，一次是后台开发，两次是前台开发。去年11月份的时候第一次去金山面试服务器开发的职位，很多问题都没有答上来，就惨淡离去了。后来又有一个前端开发的岗位，抱着试一试的态度就去了。
第一次前端面试
刚开始跟第一个面试官聊得挺不错，技术问题讨论完了，面试官问我能否带项目，我表示自己暂时没有那个能力。面试官又问及学习能力，我表示自己平时一直坚持学习新知识，也有读一些书，然后这个面试官就出去了。出去以后听到外面有人在讨论，我隐约听到刚才的面试官说：「他完全不符合这个岗位的要求』。我想，看来这次又没戏了，然后安慰自己：没关系，回去继续学习就好了，反正知识都是自己的。
过了一会，进来了两个人，一个是项目组的经理，另外一个不知道是什么职位。经理首先跟我说，他们不是进来面试的，就是想跟我聊一下。那就聊呗。原来他们是想招一个有三五年经验的可以直接带项目的人，目前有一个项目的重构工作要做，不过看我表现还行，就想看下我有没有这个能力在短时间内成长为这样的角色。这个时候我内心是窃喜的，对于一个只有一年多工作经验的新人来说，能有这样一个锻炼的机会是多么宝贵，可是又觉得压力挺大，毕竟之前都是在 leader 手下工作，只是做一下 task，框架设计类的工作都是 leader 做好的，我只在里面添加功能而已。
后面一直聊，关于能否胜任这个职位，我始终都没有给经理一个准确的答复，只表示这对我是一个很大的挑战，也是我努力的方向。我想，后来没有拿到这个职位主要也是因为这个原因吧。不过职位是双向选择的，即使我愿意，他们也肯定会把我跟其他应聘者比较，最终选出合适的人选。
跟这个经理聊完已经快要六点了，这个时候我又累又渴，聊了这么久口干舌燥。经理出去后，HR 助理过来说 HR 还在面试别人，等下会过来，让我再稍等一会。那天好像有很多实习生过来，所以就把我排在了最后。
终于等到了 HR，HR 看起来也很疲倦，我就首先向她慰问，表示辛苦了。然后 HR 简单地聊了几句，就结束了，整个过程不到五分钟。
第二天 HR 助理打来电话，说我跟职位要求不是特别符合，不过有另外一个部门的职位问我愿不愿意试一下。我说愿意啊，然后答应过几天再去面试。感觉好累啊。
第二次面试
再一次去面试就轻松多了，跟第一个面试官简单聊了几个技术问题，写了几行代码他就出去了。第二个面试官是经理，也没有多聊，问了一些 HTTP 的问题，就 OK 了，两个面试加一起半个小时不到。
然后 HR 助理过来说之前也跟 HR 聊过了，让我先回去等通知，我就回去了。
第二天收到了 offer，工资比我要的低了一点，不过总体还算满意，就答应了。
为什么跳槽
首先我的老东家 OOCL 真是一家挺不错的公司，尤其在培养人方面非常舍得投入。而且各种分享，演讲都非常多。入职的时候跟 OOCL 签的培训协议，如果干不满两年，需要赔偿 X 美金（按月递减）的违约金。违约金还挺多的，不过个人觉得非常值，比在社会上报那些乱七八糟的培训班强多了。工作前三个月半封闭脱产培训，请的中科院的老师，讲课深入浅出，在那几个月内我也进步很大。最后离职的时候由于我只工作了一年半，赔偿了一部分钱。除了培训以外，OOCL 整个福利待遇在珠海来说也都算不错，每年两次调薪，竞争力还是比较大。
OOCL 这么好你为啥要走呢？
OOCL 是一个船运公司，有非常复杂的业务。在 OOCL 的时间大部分都在搞业务，而且做的东西很杂，感觉学了很多东西，又样样都不精通。去面试后端的时候，关于缓存，高并发之类的问题都没能答上来。而在互联网公司会觉得自己跟用户更近一些，业务方面也会很好理解。专职做前端或者后端会让自己在某个领域更精通一些，我还是希望成为某个领域的砖家，在金山这个理想实现起来会更快一些。
金山怎么样啊？
今天是入职第二天，说实话给不了太多的评价，只能从外部简单对比一下 OOCL 和金山。
穿着
OOCL 是香港的公司，感觉大家更 formal 一些，邮件、IM 基本都是英文，穿着也不会太随意。金山是典型的互联网公司，穿拖鞋短裤是家常便饭。
食堂
OOCL 没有食堂，不过培训的时候有中餐可以吃，质量参差不齐，好坏看运气。金山的食堂真心不错，荤素搭配，米面汤粉都有，而且三餐免费，赞。
办公环境
办公环境的话 OOCL 就略胜一筹了，安静整洁，空调全年恒温。金山要乱一些，平时很多人说话，甚至还有人戴着耳机听歌的时候跟着吹口哨。还有一个要吐槽金山的是，新到职，没有新电脑用，为什么大家都有 mac 用，我只能用 win？
加班
OOCL 是不加班的，即使有项目特别紧的时候加班，也会把加班的时间补给你，也就是可以在项目没那么紧的时候多休几天假，这点很人性化。金山据说加班挺严重的，目前还不知道如何。
待遇
其实这次跳槽，没有涨多少工资，感觉待遇差不太多。不知道这边工资上升空间大不大。不过金山住房公积金交 12%，这点不错。
技术
技术上其实 OOCL 算是一个比较敢尝新的公司，除了公司主要业务网站一直坚持 JavaEE 的技术栈以外，很多新的业务都是用比较新的技术做的。比如我去年就接触了 MEAN、Hadoop、Scala、Spark、HBase、Hive、Impala、机器学习等很多比较新潮的技术，虽然很多都是浅尝辄止。也是前面几个月维护一个 Node.JS 的项目让我对 JavaScript 生态产生了兴趣，最终转入前端行业的。金山这边似乎也是比较愿意接受吸纳新技术，就我在的项目组而言，已经开始完全用 ES6 开发产品，对 React 和 Vue 也采取乐观的态度。
最后
今年我的目标是丰富自己前端技术栈，提高自己独立开发的能力，弥补自己 CSS 方面的劣势。无论如何，希望今后能过得更好，技术要来越好，钱越来越多。


ReactJS 学习——组件2
2017-02-13T19:35:03.000Z
组件列表
使用循环的方式创建组件列表
1
2
3
4
5
6
7
8
const numbers = [1, 2, 3, 4, 5];
const listItems = numbers.map((number) =>
  {number}</li>
);
ReactDOM.render(
  {listItems}l>,
  document.getElementById('root')
);
使用参数
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
function NumberList(props) {
  const numbers = props.numbers;
  const listItems = numbers.map((number) =>
    
      {number}
    </li>
  );
  return (
    {listItems}l>
  );
}

const numbers = [1, 2, 3, 4, 5];
ReactDOM.render(
  ,
  document.getElementById('root')
);
注意上面代码中的 key，它是一个 string 类型的属性，在创建 lists 元素的时候，你需要添加这个属性，如果不添加会有 warning。
Keys
React 元素可以具有一个特殊的属性 key，这个属性不是给用户用的，而是给 React 自己用的。如果我们动态地创建 React 元素，而且 React 元素内包含数量或顺序不确定的子元素时，我们就需要提供 key 这个特殊的属性。
为什么需要给每一个元素一个标识呢？我们知道当组件的属性发生了变化，其 render 方法会被重新调用，组件会被重新渲染。比如元素里面 [{name: 'Leo'}] => [{name: 'Jack'}] 那么有可能是删除了 Leo，然后为 Jack 新建了一个，也有可能是更改了 name 属性，因此为数组中的元素传一个唯一的 key（比如用户的 ID），就很好地解决了这个问题。React 比较更新前后的元素 key 值，如果相同则更新，如果不同则销毁之前的，重新创建一个元素。
Keys 的用法
Keys 只能被定义在循环里面
以下用法都是错误的
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
function ListItem(props) {
  const value = props.value;
  return (
    // Wrong! There is no need to specify the key here:
    
      {value}
    </li>
  );
}

function NumberList(props) {
  const numbers = props.numbers;
  const listItems = numbers.map((number) =>
    // Wrong! The key should have been specified here:
    >
  );
  return (
    
      {listItems}
    </ul>
  );
}

const numbers = [1, 2, 3, 4, 5];
ReactDOM.render(
  >,
  document.getElementById('root')
);
下面是正确的用法：
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
function ListItem(props) {
  // Correct! There is no need to specify the key here:
  return <li>{props.value}li>;
}

function NumberList(props) {
  const numbers = props.numbers;
  const listItems = numbers.map((number) =>
    // Correct! Key should be specified inside the array.
    
              value={number} />
  );
  return (
    
      {listItems}
    </ul>
  );
}

const numbers = [1, 2, 3, 4, 5];
ReactDOM.render(
  >,
  document.getElementById('root')
);



Fetch API 使用
2017-02-12T16:25:06.000Z
背景
在上一章学习 React 组件的时候，想增加 React 对 Ajax 支持的内容，却发现网上的教程竟然用 jQuery 完成 Ajax 请求，个人觉得为了发送一个简单的请求引入 jQuery 库杀鸡焉用宰牛刀啊。其实 W3C 已经有了更好的替代品，那就是： Fetch API。
Fetch API
Fetch API 的出现与 JavaScript 异步编程模型 Promise 息息相关，在 Fetch API 出现之前，JavaScript 通过 XMLHttpRequest(XHR) 来执行异步请求，XHR 将输入、输出和事件模型混杂在一个对象里，这种设计并不符合职责分离的原则。而且，基于事件的模型与 Promise 以及基于 Generator 的异步编程模型不太搭。
Fetch API 提供了对 Headers，Request，Response 三个对象的封装，以及一个 fetch() 函数用来获取网络资源，并且在离线用户体验方面，由于 ServiceWorkers 的介入，Fetch API 也能提供强大的支持。
兼容性
fetch() 方法被定义在 window 对象中，你可以直接在控制台中输入 fetch() 查看浏览器是否支持，gitHub 上有基于低版本浏览器的兼容实现。
简单示例
fetch() 方法接受一个参数——资源的路径。无论请求成功与否，它都返回一个 promise 对象，resolve 对应请求的 Response 对象。
1
2
3
4
5
6
7
8
9
10
11
12
13
let myImage = document.querySelector('.my-image');
fetch('https://lz5z.com/assets/img/avatar.png')
  .then(response => {
    if (!response.ok) return new Error(response);
    return response.blob();
  })
  .then(myBlob => {
    let objectURL = URL.createObjectURL(myBlob);
    myImage.src = objectURL;
  })
  .catch(err => {
    console.log(err);
  });
点击查看效果
在获取请求的 Response 对象后，通过该对象的 json() 方法可以将结果作为 JSON 对象返回，response.json() 同样会返回一个 Promise 对象，因此可以继续链接一个 then() 方法。相比传统的 XHR 的基于事件类型的编程方式，四不四简单很多哈。
Request 对象
Fetch API 引入了3个接口，它们分别是 Headers，Request 以及 Response 。他们直接对应了相应的 HTTP 概念，但是基于安全考虑，有些区别，例如支持CORS规则以及保证 cookies 不能被第三方获取。
通过 Request 构造器函数创建一个新的请求对象，这也是建议标准的一部分。 第一个参数是请求的 url，第二个参数是一个选项对象，用于配置请求。然后将 Request 对象传递给 fetch() 方法，用于替代默认的 url 字符串。
1
2
3
4
5
6
7
//不缓存响应结果， 方法为 GET
let req = new Request(url, {method: 'GET', cache: 'reload'});
fetch(req).then(response => {
  //
}).catch(err => {
  console.log(err);
});
除此之外，还可以基于 Request 对象创建新对象，比如将一个 GET 请求创建成为一个 POST 请求
1
2
let postReq = new Request(req, {method: 'POST'});
console.log(postReq.method); //"POST"
Headers 对象
每个 Request 对象都有一个 header 属性，在 Fetch API 中它对应了一个 Headers 对象。 我们可以使用 Headers 对象构建 Request 对象。而在 Response 对象中也有一个 header 属性，但是响应头是只读的。
Headers 接口是一个简单的多映射的名-值表
1
2
3
4
5
6
let headers = new Headers();
headers.append('Accept', 'application/json');
let request = new Request(url, {headers: headers});
fetch(request).then(response => {
  console.log(response.headers);
});
也可以传一个多维数组或者 json：
1
2
3
4
5
6
7
8
9
10
reqHeaders = new Headers({
  "Content-Type": "text/plain",
  "Content-Length": content.length.toString(),
  "X-Custom-Header": "ProcessThisImmediately",
});
//操作 Headers 中的内容
reqHeaders.has("Content-Type") //true
reqHeaders.get("Content-Type") //"text/plain"
reqHeaders.set("Content-Type", "text/html")
reqHeaders.delete("X-Custom-Header");
Response 对象
构建 Respondse 对象有什么用呢？通常 Response 的内容在服务端生成，但是 Fetch API 是浏览器里面的内容啊。
对了，就是为了离线应用，通过 Service Worker 浏览器能够获取请求头的内容，然后通过在浏览器中构建响应头来替换来自服务器的响应头以达到构建离线应用的目的（这方面内容以后再说）。
构建方法
1
2
3
4
let response = new Response(
  JSON.stringify({photos: {photo: []}}),
    {status: 200, headers: headers}
);
steam 支持
Request 和 Response 对象中的 body 只能被读取一次，它们有一个属性叫 bodyUsed，读取一次之后设置为 true，就不能再读取了。
1
2
3
4
5
6
let res = new Response("one time use");
console.log(res.bodyUsed); //false
res.text().then(v => {
  console.log(v); //"one time use"
  console.log(res.bodyUsed); // true
});
这样设计的目的是为了之后兼容基于流的 API，让应用只能消费一次 data，这样就允许了 JavaScript 处理大文件例如视频，并且可以支持实时压缩和编辑。
clone 支持
如何让 body 能经得起多次读取呢？Fetch API 提供了一个 clone() 方法。调用这个方法可以得到一个克隆对象。不过要记得，clone() 必须要在读取之前调用，也就是先 clone() 再读取。
1
2
3
4
let res = new Response("many times use");
console.log(res.bodyUsed); //false
let clone = sheep.clone();
console.log(res.bodyUsed); //false
总结
虽然 Fetch API 提供了更加简洁的接口，Promise 形式的编程体验，但是它也不是完美的，最大的问题就是不能中断一个请求，并且无法检测一个请求的进度，这些在 XHR 中早就有很好的解决方案。也行 Fetch API 需要更多的时间。


ReactJS 学习——组件
2017-02-08T17:02:15.000Z
ReactJS 组件
React 提倡组件化的开发方式，每个组件只关心自己部分的逻辑，使得应用更加容易维护和复用。
React 还有一个很大的优势是基于组件的状态更新视图，对于测试非常友好。
数据模型
state
React 每一个组件的实质是状态机（State Machines），在 React 的每一个组件里，通过更新 this.state，再调用 render() 方法进行渲染，React 会自动把最新的状态渲染到网页上。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
class HelloMessage extends React.Component {
  constructor() {
    super();
    this.handleClick = this.handleClick.bind(this);
    this.state = {enable: false};
  }
  
  handleClick() {
    this.setState({enable: !this.state.enable})
  }
  
  render() {
    return (
      
        "text" disabled={this.state.enable} /> 
        
通过在组件的 constructor 中给 this.state 赋值，来设置 state 的初始值，每当 state 的值发生变化， React 重新渲染页面。
注意：
(1) 请不要直接编辑 this.state，因为这样会导致页面不重新渲染
1
2
// Wrong
this.state.comment = 'Hello';
使用 this.setState() 方法来改变它的值
1
2
// Correct
this.setState({comment: 'Hello'});
(2) this.state 的更新可能是异步的(this.props 也是如此)
React 可能会批量地调用 this.setState() 方法，this.state 和 this.props 也可能会异步地更新，所以你不能依赖它们目前的值去计算它们下一个状态。
比如下面更新计数器的方法会失败：
1
2
3
4
// Wrong
this.setState({
  counter: this.state.counter + this.props.increment,
});
第二种形式的 setState() 方法接收的参数为一个函数而不是一个对象。函数的第一个参数为 previous state，第二个参数为当前的 props
1
2
3
4
// Correct
this.setState((prevState, props) => ({
  counter: prevState.counter + props.increment
}));
实现一个计数器
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
class HelloMessage extends React.Component {
  constructor(props) {
    super(props);
    this.handleClick = this.handleClick.bind(this);
    this.state = {counter: 0};
  }

  handleClick() {
    this.setState((prevState, props) => ({
      counter: prevState.counter + parseInt(props.increment)
    }));
  }

  render() {
    return (
      
        {this.state.counter}</h1> 
        
props
React 的数据流是单向的，是自上向下的层级传递的，props 可以对固定的数据进行传递。
1
2
3
4
5
class Welcome extends React.Component {
  render() {
    return <h1>Hello, {this.props.name}h1>;
  }
}
state vs props
state 和 props 看起来很相似，其实是完全不同的东西。
一般来说，this.props 表示那些一旦定义，就不再改变的特性，比如购物车里的商品名称、价格，而 this.state 是会随着用户互动而产生变化的特性，比如用户购买商品的个数。
获取 DOM
在 React 中，我们可以通过 this.refs 方便地获取 DOM：
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
class HelloMessage extends React.Component {
  constructor() {
    super();
    this.handleClick = this.handleClick.bind(this);
  }
  
  handleClick() {
    alert(this.refs.myInput.value);
  }
  
  render() {
    return (
      
        "myInput" /> 
        
生命周期
React 组件的生命周期分为三类：
(1) 挂载(Mounting): 已插入真实 DOM
componentWillMount()： 在初次渲染之前执行一次，最早的执行点
componentDidMount()： 在初次渲染之后执行
getInitialState() –> componentWillMount() –> render() –> componentDidMount()
(2) 更新(Updating): 正在被重新渲染
componentWillReceiveProps()： 在组件接收到新的 props 的时候调用。在初始化渲染的时候，该方法不会调用。
shouldComponentUpdate()： 在接收到新的 props 或者 state，将要渲染之前调用。
componentWillUpdate()： 在接收到新的 props 或者 state 之前立刻调用。
componentDidUpdate()： 在组件的更新已经同步到 DOM 中之后立刻被调用。
componentWillReceiveProps() –> shouldComponentUpdate() –> componentWillUpdate –> render() –> componentDidUpdate()
(3) 移除(Unmounting): 已移出真实 DOM
componentWillUnmount()： 在组件从 DOM 中移除的时候立刻被调用。
下面举 React 官网的一个输出时间的例子，在 Clock 渲染之前设置一个定时器，每隔一秒更新一下 this.state.date 的值，并在组件移除的时候清除定时器。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
class Clock extends React.Component {
  constructor(props) {
    super(props);
    this.state = {date: new Date()};
  }
  //组件初次渲染之后执行
  componentDidMount() {
    this.timerID = setInterval(
      () => this.tick(),
      1000
    );
  }
  //组件移除的时候执行
  componentWillUnmount() {
    clearInterval(this.timerID);
  }
  
  tick() {
    this.setState({
      date: new Date()
    });
  }
  
  render() {
    return (
      
        Hello, world!</h1>
        It is {this.state.date.toLocaleTimeString()}.h2>
      </div>
    );
  }
}
//渲染
ReactDOM.render(
  >,
  document.getElementById('root')
);
事件
React 内建的跨浏览器的事件系统，我们可以在组件里添加属性来绑定事件和相应的处理函数。这种事件绑定方法极大的方便了事件操作，不用再像以前先定位到 DOM 节点，再通过 addEventListener 绑定事件，还要用 removeEventListener 解绑。当组件注销时，React 会自动帮我们解绑事件。
React 处理事件与 DOM 处理事件非常相似，有以下两点不同：
React 事件用驼峰命名法，而不是全小写
通过 JSX 语法传递函数作为事件处理器，而不是字符串
1
2
3
4
5
6
7
8
9
10
11
12
13
class LoggingButton extends React.Component {
  handleClick = () => {
    console.log('this is:', this);
  }

  render() {
    return (
      
另外一个不同的是 React 不支持向事件处理函数 return false，一般 HTML 事件函数中，可以通过 return false 来阻止默认行为，比如
1
2
3
"#" onclick="console.log('The link was clicked.'); return false">
  Click me
</a>
Vue 阻止浏览器默认行为的方式最简单，用一个装饰符就可以搞定 
。
而在 React 中，必须调用 preventDefault 方法才能完成以上功能。
1
2
3
4
5
6
7
8
9
10
11
12
function ActionLink() {
  function handleClick(e) {
    e.preventDefault();
    console.log('The link was clicked.');
  }

  return (
    "#" onClick={handleClick}>
      Click me
    </a>
  );
}
在这里的 e 是 React 封装过后的，因此不用担心游览器差异带来的影响。☺
条件渲染
假设 Greeting 组件根据状态选择渲染 UserGreeting 和 GuestGreeting 中的一个。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
function UserGreeting(props) {
  return <h1>Welcome back!h1>;
}

function GuestGreeting(props) {
  return <h1>Please sign up.h1>;
}

function Greeting(props) {
  const isLoggedIn = props.isLoggedIn;
  if (isLoggedIn) {
    return <UserGreeting />;
  }
  return <GuestGreeting />;
}

class LoginControl extends React.Component {
  constructor(props) {
    super(props);
    this.handleLogoutClick = this.handleLogoutClick.bind(this);
    this.state = {isLoggedIn: false};
  }
  handleLogoutClick() {
    this.setState({isLoggedIn: !this.state.isLoggedIn});
  }

  render() {
    const isLoggedIn = this.state.isLoggedIn;
    let button = null;
    if (isLoggedIn) {
      button = <LogoutButton onClick={this.handleLogoutClick} />;
    } else {
      button = <LoginButton onClick={this.handleLogoutClick} />;
    }

    return (
      
        
        {button}
      </div>
    );
  }
}
行内条件判断
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
function Mailbox(props) {
  const unreadMessages = props.unreadMessages;
  return (
    
      Hello!</h1>
      {unreadMessages.length > 0 &&
        
          You have {unreadMessages.length} unread messages.
        h2>
      }
    </div>
  );
}

const messages = ['React', 'Re: React', 'Re:Re: React'];
ReactDOM.render(
  >,
  document.getElementById('root')
);
其它类型的逻辑判断，像三元运算符，if else React 也均支持。
1
2
3
4
5
6
7
8
render() {
  const isLoggedIn = this.state.isLoggedIn;
  return (
    
      The user is {isLoggedIn ? 'currently' : 'not'}</b> logged in.
    div>
  );
}
1
2
3
4
5
6
7
8
9
10
11
12
render() {
  const isLoggedIn = this.state.isLoggedIn;
  return (
    
      {isLoggedIn ? (
        this.handleLogoutClick} />
      ) : (
        this.handleLoginClick} />
      )}
    </div>
  );
}
阻止组件渲染
通过在组件内部 return null 可以达到阻止组件渲染的
1
2
3
4
5
6
7
8
9
10
11
function WarningBanner(props) {
  if (!props.warn) {
    return null;
  }

  return (
    "warning">
      Warning!
    </div>
  );
}
最后
第一章 React 入门 和本章 React 组件都是比较基础的内容，后面会学习全新的程序设计模式 Flux 和 Redux 来管理应用的状态，很多函数式编程的思想正好努力学习一下。


ReactJS 学习——入门
2017-02-05T14:45:55.000Z
ReactJS 简介
React 首次被提出是在2014年的 F8 大会上，当期的主题为 “Rethinking Web App Development at Facebook”，这也是 React 名字的由来。
React 以组件化的开发方式，专注于 MVC 架构中的 View，即视图， 这使得React很容易和开发者已有的开发栈进行融合。React 推荐将 UI 上每一个功能相对独立的模块定义成组件，然后将小的组件通过组合或者嵌套的方式构成大的组件，最终完成整体 UI 的构建。
ReactJS 原理
Web 开发的最终目的是把数据反映到 UI 上，这时就需要对 DOM 进行操作，复杂或者频繁的 DOM 操作通常是性能瓶颈产生的原因。React 为此引入了虚拟 DOM（Virtual DOM） 的机制：开发者操作虚拟 DOM，React 在必要的时候将它们渲染到真正的 DOM 上。
Virtual DOM
基于 React 进行开发时所有的 DOM 构造都是通过虚拟 DOM 进行，每当数据变化时，React 都会重新构建整个 DOM 树，然后 React 将当前整个 DOM 树和上一次的 DOM 树进行对比，得到 DOM 结构的区别，然后仅仅将需要变化的部分更新到实际的浏览器。
同时 React 能够批处理虚拟 DOM 的刷新，在一个事件循环（Event Loop）内的两次数据变化会被合并，例如你连续的先将节点内容从 A 变成 B，然后又从 B 变成 A，React 会认为 UI 不发生任何变化。尽管每一次都需要构造完整的虚拟 DOM 树，但是因为虚拟 DOM 是内存数据，性能是极高的，而对实际 DOM 进行操作的仅仅是 Diff 部分，因而能达到提高性能的目的。
Hello World
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
html>
<html>
  <head>
    <meta charset="UTF-8" />
    <title>Hello Worldtitle>
    <script src="https://unpkg.com/react@latest/dist/react.js">script>
    <script src="https://unpkg.com/react-dom@latest/dist/react-dom.js">script>
    <script src="https://unpkg.com/babel-standalone@6.15.0/babel.min.js">script>
  head>
  <body>
    <div id="root">div>
    <script type="text/babel">
      ReactDOM.render(
        <h1>Hello, world!h1>,
        document.getElementById('root')
      );
    script>
  body>
html>
上面的 Hello World 的例子中，引入了三个库文件，react.js，react-dom.js 和 babel.js，它们必须首先加载。在之前的版本中，需要加载 “JSXTransformer.js”，后来 React 官方不再维护这个库，由 babel 对 JSX 语法进行编译。
ReactDOM.render 是 React 的最基本方法，用于将模板转为 HTML 语言，并插入指定的 DOM 节点。
create-react-app
一般我们启动一个 React 项目会使用 React 脚手架工具 create-react-app,它会帮助你创建一个基于 webpack、Babel 和 ESLint 的单页面项目。
1
2
3
4
$ yarn global add create-react-app
$ create-react-app react-demo
$ cd react-demo
$ yarn start
项目启动后会有一个 “Welcome to React” 的页面自动打开。
打开 package.json 文件，发现并没有找到 webpack、Babel 等 package 相关的依赖，所有的工作都是 “react-scripts” 帮助我们做的，这样极大地降低了初学者入门学习 React 的成本。
JSX
HTML 语言直接写在 JavaScript 语言之中，不加任何引号，这就是 JSX 的语法，它允许 HTML 与 JavaScript 的混写。
例如：
1
2
3
4
5
6
7
8
9
10
11
let names = ['Leo', 'Jack', 'John'];
ReactDOM.render(
  
  {
    names.map((name)=>{
      return <div>{name}div>
    })
  }
  </div>,
  document.getElementById('root')
);
上面代码体现了 JSX 的基本语法规则：遇到 HTML 标签（以 < 开头），就用 HTML 规则解析；遇到代码块（以 { 开头），就用 JavaScript 规则解析。
JSX 允许直接在模板插入 JavaScript 变量。如果这个变量是一个数组，则会展开这个数组的所有成员，代码如下：
1
2
3
4
5
6
7
8
9
10
let arr = [
  Hello</h1>, 
  worldh1>
];
ReactDOM.render(
  
  {arr}
  </div>,
  document.getElementById('root')
);
ReactDOM.render 方法也可以写在函数中，例如：
1
2
3
4
5
6
7
8
9
let t0 = new Date().getTime();
setInterval(()=>{
  let t = new Date().getTime(),
  delta = t - t0;
  //在虚拟DOM上创建元素
  let el = React.createElement("p",null,delta);
  //渲染到真实DOM
  ReactDOM.render(el,document.getElementById('root'));
},16);
React 组件
定义 React 组件有三种方法，第一种是 JavaScript 函数，第二种是用 ES6 classes 的方式，一个是用 React.createClass(已经过时)
JavaScript 函数
1
2
3
4
5
6
7
function HelloMessage(props) {
  return <h1>Hello, {props.name}h1>;
}
ReactDOM.render(
    "Leo"/>,
    document.getElementById('root')
);
注意这里调用属性的时候没有 this。
React.Component
1
2
3
4
5
6
7
8
9
class HelloMessage extends React.Component {
  render() {
    return <h1>Hello, {this.props.name}h1>;
  }
}
ReactDOM.render(
  "Leo"/>,
  document.getElementById('root')
);
React.createClass
React.createClass(meta) 方法用于生成组件类，参数 meta 是一个实现预定义接口的 JavaScript 对象，用来对 React 组件原型进行扩展。
在 meta 中，至少需要实现一个 render() 方法，而这个方法， 必须而且只能返回一个有效的 React 元素。这意味着，如果你的组件是由多个元素构成的，那么你必须在外边包一个顶层元素，然后返回这个顶层元素。
1
2
3
4
5
6
7
8
9
const HelloMessage = React.createClass({
  render: function() {
    return <h1>Hello {this.props.name}!h1>;
  }
});
ReactDOM.render(
  "Leo"/>,
  document.getElementById('root')
);
组件名必须以大写字母开头
组件类只能包含一个顶层标签
获取属性的值用的是 this.props.属性名
为元素添加 css 的 class 时，要用 className，for 属性需要写成 htmlFor， 因为 class 和 for 是 ES6 关键字
内联 css
1
2
3
4
5
6
const HelloMessage = React.createClass({
  render: function() {
    return <div style={{color:"red",fontSize: "44px"}}>
          Hello {this.props.name}!div>;
  }
});
内联 css 的写法与用 JavaScript 直接操作样式相同：
1
document.getElementById('root').style.paddingLeft='104px';
组件组合
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
//组合组件
class WebSite extends React.Component {
  render() {
    return (
      
        this.props.name} />
        this.props.site} />
      </div>
    );
  }
}
//Name组件
class Name extends React.Component {
  render() {
    return (
      {this.props.name}h1>
    );
  }
};
//L****ink组件
class Link extends React.Component {
  render() {
    return (
      this.props.site}>
        {this.props.site}
      </a>
    );
  }
};

ReactDOM.render(
  /lz5z.com" />,
  document.getElementById('root')
);
最后
ReactJS 入门暂时就到这里，后面会有更加详细的内容。


Yarn 管理 JavaScript 模块
2017-02-01T19:42:03.000Z
Yarn 简介
Yarn 是 Facebook 开发的一款新的 JavaScript 包管理工具， 作为 NPM 的替代产品，主要是为了解决下面两个问题：
安装的时候无法保证速度/一致性
安全问题，因为 NPM 安装时允许运行代码
Yarn vs NPM
速度快
相比于 NPM，Yarn 的速度更快，Yarn 会把使用过的模块在本地缓存一份，如果下次还要用到相同版本的模块，那么将会直接使用本地的而不是访问网络重新获取一份。而 NPM 使用的时候，如果不全局安装那么每个项目都要重新下载一次包，浪费时间和资源。
安全性
Yarn 在安装模块之前会验证文件完整性。
并行安装
每当 NPM 或 Yarn 需要安装一个包时，它会进行一系列的任务。在 NPM 中这些任务是按包的顺序一个个执行，这意味着必须等待上一个包被完整安装才会进入下一个；Yarn 则并行的执行这些任务，提高了性能。
输出清晰
NPM 安装包的时候输出惨不忍睹，而 Yarn 的输出就清晰多了。
使用
常用命令对照表
作用 NPM 命令 Yarn 命令
初始化 npm init yarn init
安装 package.json 中的包 npm install yarn
安装某个包 npm install xxx --save yarn add xxx
删除某个包 npm uninstall xxx --save yarn remove xxx
开发模式下安装某个包 npm install xxx --save-dev yarn add xxx -dev
更新 npm update --save yarn upgrade
全局安装 npm install xxx –global yarn global add xxx
清除缓存 npm cache clean yarn cache clean
查看模块信息 npm info xxx yarn info xxx
运行script npm run yarn run
测试 npm test yarn test
yarn.lock 文件
在使用 NPM 管理 JavaScript 模块的时候，可以用比较宽松的方式定义某个模块的版本信息，如
1
2
3
4
5
*: 任意版本
~1.1.0: >=1.1.0 && < 1.2.0
^1.1.0: >=1.1.0 && < 2.0.0
>= 1.0.0: >= 1.0.0
3.x: 任意 3 版本
理想状态下使用语义化版本发布补丁不会包含大的变化，但不幸的很多时候并非如此。NPM 的这种策略可能导致两台拥有相同 package.json 文件的电脑安装了不同版本的包，这可能导致一些错误。很多模块的安装错误和环境问题都是由于这个原因导致。
为了避免包版本的错误匹配，一个确定的安装版本被固定在一个锁文件中。每次模块被添加时，Yarn 就会创建（或更新） yarn.lock 文件，这样你就可以保证其它电脑也安装相同版本的包，同时包含了 package.json 中定义的一系列允许的版本。
在 npm 中同样可以使用 npm shrinkwrap 命令来生成一个锁文件，这样在使用 npm install 时会在读取 package.json 前先读取这个文件，就像 Yarn 会先读取 yarn.lock 一样。这里的区别是 Yarn 总会自动更新 yarn.lock，而 npm 需要你重新操作。
yarn install
npm install 命令会根据 package.json 安装依赖以及允许你添加新的模块； yarn install 仅会按照 yarn.lock 或 package.json 里面的依赖顺序来安装模块。
yarn add [–dev]
与 npm install 类似，yarn add 允许你添加与安装模块，添加依赖的同时也会将依赖写入 package.json，类似 npm 的 --save 参数；Yarn 的 --dev 参数则是添加开发依赖，类似 npm 的 --save-dev 参数。
yarn global
不像 npm 添加 -g 或 --global 可以进行全局安装，Yarn 使用的是 global 前缀（yarn global add xxx）。global 前缀只能用于 yarn add, yarn bin, yarn ls 和 yarn remove。
yarn why
该命令会查找依赖关系并找出为什么会将某些包安装在你的项目中。也许你知道为什么添加，也许它只是你安装包中的一个依赖，yarn why 可以帮你找出。
总结
相比 NPM，Yarn 可以方便生成锁文件，安装模块时非常迅速并且会将依赖自动添加进 package.json，模块可以并行安装。不过个人认为，Yarn 的优势不是绝对的，毕竟 NPM 久经考验，或许不久的将来，NPM 也会拥有这些特性。


Gulp 快速入门
2017-01-18T16:09:35.000Z
[图片摘自「程序员的那些事」]什么是 gulp
简单的讲，gulp 是一个构建工具，一个基于流的构建工具，一个 nodejs 写的构建工具，使用 gulp 的目的就是为了自动化构建，提高程序员工作效率😂。
入门指南
全局安装 gulp：
1
$ npm install --global gulp
作为项目的开发依赖（devDependencies）安装：
1
$ npm install --save-dev gulp
在项目根目录下创建一个名为 gulpfile.js 的文件：
1
2
3
4
5
var gulp = require('gulp');
// 默认task
gulp.task('default', () => {
  console.log('Hello World')
});
运行 gulp：
1
$ gulp
默认的名为 default 的任务（task）将会被运行。
想要单独执行特定的任务（task），请输入
1
$ gulp  。
tasks 依赖
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
var gulp = require('gulp');
// task1
gulp.task('task1', () => {
console.log('task1');
});
// task2
gulp.task('task2', () => {
setTimeout(() => {
console.log('task2')
}, 1000);
});
// 在执行 default 之前先执行 task1 和 task2
gulp.task('default', ['task1', 'task2'], () => {
console.log('Hello World');
});
输出顺序为：
task1
Hello World
task2
流式处理
(1) 在项目根目录下创建 src 文件目录，里面创建 index.js
(2) 在项目根目录下创建 dist 文件目录
(3) 安装 gulp-uglify
1
$ npm install gulp-uglify --save-dev
(4) 使用 gulp 压缩 index.js 并将结果输出
1
2
3
4
5
6
7
8
var gulp = require('gulp');
var uglify = require('gulp-uglify');
// 压缩js
gulp.task('default', () => {
gulp.src('src/*.js')
.pipe(uglify())
.pipe(gulp.dest('dist'))
});
(5) 运行 “gulp” 命令后发现在 dist 目录下生产了压缩后的 index.js
(6) 解释
gulp.src 是输入； gulp.dest 是输出
pipe 是管道的意思，也是 stream 里核心概念，pipe 将上一个的输出作为下一个的输入。src 里所有 js，经过处理1，处理2，变成输出结果，中间的处理 pipe 可以1步，也可以是n步。第一步处理的结果是第二步的输入，以此类推，就像生产线一样，每一步都是一个 task 是不是很好理解呢？
每个独立操作单元都是一个 task，使用 pipe 来组装 tasks，于是 gulp 就变成了基于 task 的组装工具。
gulp.src()
在上面的例子中，gulp.src() 函数用字符串匹配一个文件或者文件的编号（被称为“glob”）,然后创建一个对象流来代表这些文件，接着传递给 uglify() 函数，它接受文件对象之后返回有新压缩源文件的文件对象，最后那些输出的文件被输入 gulp.dest()函数，并保存下来。
gulp.src() 可以接收以下类型的参数：
js/app.js 精确匹配文件
js/.js 仅匹配 js 目录下的所有后缀为 .js 的文件
js//.js 匹配 js 目录及其子目录下所有后缀为 .js 的文件
!js/app.js 从匹配结果中排除 js/app.js，这种方法在你想要匹配除了特殊文件之外的所有文件时非常好用
*.+(js|css) 匹配根目录下所有后缀为 .js 或者 .css 的文件
假如 js 目录下包含了压缩和未压缩的 JavaScript 文件，现在我们想要创建一个任务来压缩还没有被压缩的文件，我们需要先匹配目录下所有的 JavaScript 文件，然后排除后缀为 .min.js 的文件:
1
gulp.src(['js/**/*.js', '!js/**/*.min.js'])
babel
babel 用于转化 JavaScript 代码，比如将 ES6 的语法转化成 ES5，或者将 JSX 语法转化为 JavaScript 语法。
假如上文中提到的 index.js 里面的内容如下：
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
'use strict';
import express, { Router } from 'express';
import bodyParser from 'body-parser';
// 定义app和router
let app = express();
let router = Router();
//中间件
app.use(bodyParser.json());
app.use(bodyParser.urlencoded({ extended: true }));
//路由
router.get('/', (req, res, next) => {
  res.end('Hello World!');
});
app.use('/', router);
//启动app
app.listen(3000, () => {
  console.log('server listening at port 3000...');
});
使用 babel 转化为 ES5 语法：
(1) 安装 babel-core babel-preset-es2015
1
$ npm install --save-dev babel-core babel-preset-es2015
(2) 创建 .babelrc 文件， 配置如下
{
“presets”: [“es2015”]
}
(3) 手动使用 babel 转译：
1
$ babel src -d lib
(4) 安装 gulp-babel
1
$  npm install --save-dev gulp-babel
(5) 编写 gulpfile
在根目录新建一个 gulpfile.babel.js 文件。
gulp 原生并不支持 ES6 语法，但是我们可以告诉 gulp 使用 babel 将 gulpfile 转换为 ES5，方法就是将 gulpfile 命名为 gulpfile.babel.js。
(6) 使用 ES6 编写 gulpfile.babel.js
1
2
3
4
5
6
7
8
import gulp from 'gulp';
import babel from 'gulp-babel';
// 语法转化+压缩
gulp.task('default', () => {
gulp.src('src/*.js')
.pipe(babel())
.pipe(gulp.dest('lib'))
});
打开 lib 目录下的 index.js 文件，就可以查看 babel 编译后的 ES5 语法的文件了。
gulp-watch
开始工作以后，每次改动 index.js 都要手动 gulp 一下实在太麻烦了，使用 gulp-watch 可以监听文件变化，当文件被修改之后，自动将文件转换。
(1) 安装 gulp-watch
1
$ npm install gulp-watch --save-dev
(2) 新增 task
1
2
3
4
5
6
7
8
gulp.task('watch', () => {
gulp.src('src/*.js')
.pipe(watch('src/*.js'), {
verbose: true
})
.pipe(babel())
.pipe(gulp.dest('lib'))
});
(3) 启动 watch task
1
$ gulp watch
修改 index.js 后 lib/index.js 也会随之改变。(≧∀≦)ゞ
查看全部 tasks
1
2
3
4
$ gulp -T
[16:06:54] Requiring external module babel-register
[16:06:54] ├── default
[16:06:54] └── watch
gulp 顺序执行
默认的，task 将以最大的并发数执行，也就是说，gulp 会一次性运行所有的 task 并且不做任何等待。如果你想要创建一个序列化的 task 队列，并以特定的顺序执行，需要做两件事：
给出一个提示，来告知 task 什么时候执行完毕，
并且再给出一个提示，来告知一个 task 依赖另一个 task 的完成。
假如我想要 task1 执行完成后再执行 task2， 可以用以下三种方式：
直接返回一个流
1
2
3
4
gulp.task('task1', function () {
    return gulp.watch('src/*.js');
});
//只要加一个return就好了
返回一个promise
1
2
3
4
5
6
7
8
9
10
gulp.task('task1', function () {
  var Q = require('q');
  var deferred = Q.defer();
  // do async stuff
  setTimeout(function () {
    deferred.resolve();
  }, 1);

  return deferred.promise;
});
使用回调callback
task 的执行函数其实都有个回调，我们只需要在异步队列完成的时候调用它就好了。
1
2
3
4
5
6
gulp.task('task1', function (cb) {
  // do async stuff
  setTimeout(function () {
    cb()
  }, 1);
});
所以只要依赖的任务是上面三种情况之一，就能保证当前任务在依赖任务执行完成后再执行。这边需要注意的是依赖的任务相互之间还是并行的。需要他们按顺序的话。记得给每个依赖的任务也配置好依赖关系。
1
2
3
4
5
6
7
8
9
10
11
12
var gulp = require('gulp');
gulp.task('one', () => {
console.log('one');
});
// two 依赖 one
gulp.task('two', ['one'], () => {
console.log('two');
});
// default 依赖 one，two
gulp.task('default', ['one', 'two'], () => {
console.log('default');
});



机器学习常用算法——随机森林
2017-01-10T21:27:24.000Z
随机森林
随机森林（Random Forest，简称RF），通过集成学习的思想将多棵决策树集成的一种算法，它的基本单元是决策树。从直观角度来解释，每棵决策树都是一个分类器（假设现在针对的是分类问题），那么对于一个输入样本，N棵树会有N个分类结果。而随机森林集成了所有的分类投票结果，将投票次数最多的类别指定为最终的输出。
随机森林构建
随机采样
首先是两个随机采样的过程，random forest 对输入的数据要进行行、列的采样。
对于行采样，采用有放回的方式，也就是在采样得到的样本集合中，可能有重复的样本。假设输入样本为 N 个，那么采样的样本也为 N 个，这选择好了的 N 个样本用来训练一个决策树，作为决策树根节点处的样本，同时使得在训练的时候，每一棵树的输入样本都不是全部的样本，使得相对不容易出现 over-fitting。
对于列采样，从 M 个 feature 中，选择 m 个 (m << M)，即：当每个样本有M个属性时，在决策树的每个节点需要分裂时，随机从这 M 个属性中选取出 m 个属性，满足条件 m << M。
完全分裂
对采样之后的数据使用完全分裂的方式建立出决策树，这样决策树的某一个叶子节点要么是无法继续分裂的，要么里面的所有样本的都是指向的同一个分类。分裂的办法是：采用上面说的列采样的过程从这m个属性中采用某种策略（比如说信息增益）来选择1个属性作为该节点的分裂属性。
决策树形成过程中每个节点都要按完全分裂的方式来分裂，一直到不能够再分裂为止（如果下一次该节点选出来的那一个属性是刚刚其父节点分裂时用过的属性，则该节点已经达到了叶子节点，无须继续分裂了）。
随机森林的优点
比较适合做多分类问题，训练和预测速度快，在数据集上表现良好；
对训练数据的容错能力强，是一种有效地估计缺失数据的一种方法，当数据集中有大比例的数据缺失时仍然可以保持精度不变和能够有效地处理大的数据集；
能够处理很高维度的数据，并且不用做特征选择，即：可以处理没有删减的成千上万的变量；
能够在分类的过程中可以生成一个泛化误差的内部无偏估计；
能够在训练过程中检测到特征之间的相互影响以及特征的重要性程度；
不会出现过度拟合；
实现简单并且容易实现并行化。
例子
假设有一组相亲网站提供的数据，抽取特征后发现是否相亲有四个因素组成： 年龄，是否有房，收入，是否公务员
age, house, income, governor, go_date
30, 1, 80, 1, 1
28, 0, 30, 0, 0
29, 0, 80, 1, 1
32, 1, 40, 1, 1
32, 0, 100, 1, 1
40, 1, 30, 1, 0
28, 1, 40, 1, 1
57, 0, 80, 1, 0
45, 0, 78, 0, 0
34, 0, 70, 1, 0
…
那么假如有一个新的会员注册后，填写了信息如下，
年龄： 33
是否有房： 无
收入： 80
是否公务员： 是
那么请问这位会员是否能得到相亲的机会？
1
2
3
4
5
6
7
8
9
10
from numpy import genfromtxt
from sklearn.ensemble import RandomForestClassifier
# 加载数据
dataset = genfromtxt('data.csv', delimiter=",")
x = dataset[1:, 0:4]
y = dataset[1:, 4]
clf = RandomForestClassifier(n_jobs=2, oob_score=True)
clf = clf.fit(x, y)
# 预测
print(clf.predict_proba([[33, 0, 80, 1]]))
代码地址
参考文献
[Machine Learning & Algorithm] 随机森林（Random Forest）
sklearn中随机森林的参数


机器学习常用算法——决策树
2017-01-07T21:27:24.000Z
决策树
决策树是一个非参数的监督式学习方法，主要用于分类和回归，算法的目标是通过推断数据特征，学习决策规则从而创建一个预测目标变量的模型。决策树（decision tree）是一个树结构（可以是二叉树或非二叉树）。其每个非叶节点表示一个特征属性上的测试，每个分支代表这个特征属性在某个值域上的输出，而每个叶节点存放一个类别。使用决策树进行决策的过程就是从根节点开始，测试待分类项中相应的特征属性，并按照其值选择输出分支，直到到达叶子节点，将叶子节点存放的类别作为决策结果。
决策树（Decision Tree）是一种简单但是广泛使用的分类器。通过训练数据构建决策树，可以高效的对未知的数据进行分类。决策数有两大优点：
决策树模型可以读性好，具有描述性，有助于人工分析；
效率高，决策树只需要一次构建，反复使用，每一次预测的最大计算次数不超过决策树的深度。
决策树既可以做分类，也可以做回归。
分类树的输出是样本的类标。
回归树的输出是一个实数 (例如房子的价格，病人呆在医院的时间等)。
分类
以文章开始的图片为例子，假设银行贷款前需要审查用户信息，来确定是否批准贷款，构造数据 data.scv 如下:
house, married, income, give_loan
1, 1, 80, 1
1, 0, 30, 1
1, 1, 30, 1
0, 1, 30, 1
0, 1, 40, 1
0, 0, 80, 1
0, 0, 78, 0
0, 0, 70, 1
0, 0, 88, 1
0, 0, 45, 0
0, 1, 87, 1
0, 0, 89, 1
0, 0, 100, 1
1
2
3
4
5
6
7
8
9
10
from numpy import genfromtxt
from sklearn import tree
# 加载数据
dataset = genfromtxt('data.csv', delimiter=",")
x = dataset[1:, 0:3]
y = dataset[1:, 3]
clf = tree.DecisionTreeClassifier()
clf = clf.fit(x, y)
# 预测
print(clf.predict([[0, 0, 50]])) # [ 0.] 说明此用户不满足贷款条件
回归
回归和分类不同的是向量 y 可以是浮点数。
1
2
3
4
5
6
from sklearn import tree
X = [[0, 0], [2, 2]]
y = [0.5, 2.5]
clf = tree.DecisionTreeRegressor()
clf = clf.fit(X, y)
clf.predict([[1, 1]])
scikit-learn 官网给出的例子是：
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
import numpy as np
from sklearn.tree import DecisionTreeRegressor
import matplotlib.pyplot as plt
# 创建随机数据集
rng = np.random.RandomState(1)
X = np.sort(5 * rng.rand(80, 1), axis=0)
y = np.sin(X).ravel()
y[::5] += 3 * (0.5 - rng.rand(16))
# 训练决策树回归模型
regr_1 = DecisionTreeRegressor(max_depth=2)
regr_2 = DecisionTreeRegressor(max_depth=5)
regr_1.fit(X, y)
regr_2.fit(X, y)
# 预测
X_test = np.arange(0.0, 5.0, 0.01)[:, np.newaxis]
y_1 = regr_1.predict(X_test)
y_2 = regr_2.predict(X_test)
# 结果展示
plt.figure()
plt.scatter(X, y, c="darkorange", label="data")
plt.plot(X_test, y_1, color="cornflowerblue", label="max_depth=2", linewidth=2)
plt.plot(X_test, y_2, color="yellowgreen", label="max_depth=5", linewidth=2)
plt.xlabel("data")
plt.ylabel("target")
plt.title("Decision Tree Regression")
plt.legend()
plt.show()
决策树的使用
如果数据量大，决策树容易过拟合。样本和特征的比例非常重要。如果决策树样本少，特征多，非常可能过拟合。
可以考虑事先做维度约减(PCA，ICA)，以产生一个特征之间区别性大的决策树
通过 export 将你的训练的决策树可视化，使用 max_depth =3 作为一个初始的树的深度，有一个数据拟合决策树模型的大概感觉，然后逐渐增加深度
数据的样本量的增加将加深决策树的深度，使用 max_depth 控制决策树的尺寸以防止过拟合
使用 min_samples_split 或者 min_samples_leaf 来控制叶节点的样本数量。一个非常小的数量往往意味着过拟合，而一个较大的数可以防止过拟合。可以将 min_samples_leaf=5 作为一个初始值。如果样本数据变化巨大，可以采用一个浮点数。两者的区别在于 min_samples_leaf 保证了叶节点最小的数量，min_samples_split 能够建立任意数量的叶子节点，在文学上用到也更多
如果样本是有权重的，可以使用 min_weight_fraction_leaf 来实现基于权重的预修剪规则来优化决策树结构
决策树内部使用 np.float32 向量，如果样本不是这个形式的，将产生一个数据集的样本
如果数据矩阵 X 是非常稀疏的，建议在拟合和预测之前转换为稀疏矩阵 csc_matrix。稀疏矩阵将比稠密矩阵快数量级的速度
代码地址
参考文献
算法杂货铺——分类算法之决策树(Decision tree)
《机器学习实战》基于信息论的三种决策树算法(ID3,C4.5,CART)
Scikit-learn中的决策树


机器学习常用算法——逻辑回归
2017-01-06T21:27:24.000Z
逻辑回归
首先，逻辑回归是一个分类算法而不是一个回归算法，该算法可根据已知的一系列因变量估计离散数值（比方说二进制数值 0 或 1 ，是或否，真或假），它通过将数据拟合进一个 逻辑函数 来预估一个事件出现的概率。因为它预估的是概率，所以它的输出值大小在 0 和 1 之间（正如所预计的一样）。
[比利时的人口增长数量图]逻辑函数由于它的S形，有时也被称为sigmoid函数。
通过一个简单的例子来理解这个算法。
假设你的朋友让你解开一个谜题。这只会有两个结果：你解开了或是你没有解开（离散值）。想象你要解答很多道题来找出你所擅长的主题。这个研究的结果就会像是这样：假设题目是一道十年级的三角函数题，你有 70% 的可能会解开这道题。然而，若题目是个五年级的历史题，你只有 30% 的可能性回答正确。这就是逻辑回归能提供给你的信息。
用途
逻辑回归主要用于分类，比如邮件分类，是否肿瘤、癌症诊断，用户性别判断，预测用户购买产品类别，判断评论是正面还是负面等。
逻辑回归的数学模型和求解都相对比较简洁，实现相对简单。通过对特征做离散化和其他映射，逻辑回归也可以处理非线性问题，是一个非常强大的分类器。因此在实际应用中，当我们能够拿到许多低层次的特征时，可以考虑使用逻辑回归来解决我们的问题。
加载数据(Data Loading)
我们假设输入是一个特征矩阵或者 csv 文件，我们使用 NumPy 来载入 csv 文件。
以下是从 UCI 机器学习数据仓库中下载的数据。
1
2
3
4
5
6
7
8
9
10
import numpy as np
import urllib.request
# 加载数据
url = "http://archive.ics.uci.edu/ml/machine-learning-databases/pima-indians-diabetes/pima-indians-diabetes.data"
raw_data = urllib.request.urlopen(url)
# 把CSV文件转化为numpy matrix
dataset = np.loadtxt(raw_data, delimiter=",")
# 训练集和结果
X = dataset[:, 0:7]
y = dataset[:, 8]
数据归一化(Data Normalization)与标准化
数据归一化是指把数字变成（0,1）之间的小数。
数据的标准化是将数据按比例缩放，使之落入一个小的特定区间。
大多数机器学习算法中的梯度方法对于数据的缩放和尺度都是很敏感的，在开始跑算法之前，我们应该进行归一化或者标准化的过程，这使得特征数据缩放到 0-1 范围中。scikit-learn 提供了归一化和标准化的方法：
1
2
3
4
5
from sklearn import preprocessing
# 归一化
normalized_X = preprocessing.normalize(X)
# 标准化
standardized_X = preprocessing.scale(X)
特征选择(Feature Selection)
在解决一个实际问题的过程中，选择合适的特征或者构建特征的能力特别重要。这成为特征选择或者特征工程。
特征选择时一个很需要创造力的过程，更多的依赖于直觉和专业知识，并且有很多现成的算法来进行特征的选择。
下面的树算法(Tree algorithms)计算特征的信息量：
1
2
3
4
5
6
from sklearn import metrics
from sklearn.ensemble import ExtraTreesClassifier
model = ExtraTreesClassifier()
model.fit(X, y)
# 显示每个属性相对重要性
print(model.feature_importances_)
关于特征提取
机器学习是一个过程，这样的过程包括数据处理 + 模型训练，而特征提取是数据处理中不可或缺的一环。
比如预测什么样的生活方式特征是引发冠心病 (CHD) 的危险因素？给定具有吸烟状态、饮食、锻炼、饮酒和 CHD 状态度量的患者样本，可以使用这四个生活方式变量建立一个模型，用于预测患者样本中 CHD 的存在性。然后可使用此模型为每个因子推导几率比估计值，从而获知某些信息，例如吸烟者比非吸烟者在何种程度上更易患 CHD。
算法选择–逻辑回归
大多数问题都可以归结为二元分类问题。这个算法的优点是可以给出数据所在类别的概率。
1
2
3
4
5
6
7
8
9
10
from sklearn import metrics
from sklearn.linear_model import LogisticRegression
model = LogisticRegression()
model.fit(X, y)
# 预测
expected = y
predicted = model.predict(X)
# 模型拟合概述
print(metrics.classification_report(expected, predicted))
print(metrics.confusion_matrix(expected, predicted))
最后
以上 加载数据 -> 数据归一化 -> 特征选择 -> 算法选择 既是机器学习的一般代码逻辑。如果选择其它算法，只需要更改最后一步算法选择即可。
代码地址
参考文献
Logistic Regression 模型简介
Logistic 回归
scikit-learn的主要模块和基本使用


机器学习常用算法——线性回归
2017-01-05T21:27:24.000Z
背景
上次的 ITA 项目开始接触机器学习相关的知识，从本文开始，我将学习并介绍机器学习最常用的几种算法，并使用 scikit-learn 相关模型完成相关算法的 demo。
线性回归
线性回归，是利用数理统计中回归分析，来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。我们通过拟合最佳直线来建立自变量和因变量的关系，这条最佳直线叫做回归线，并且用 Y= a*x + b这条线性等式来表示。
理解线性回归可以想象一下一般人身高与体重之间的关系，在不能准确测试体重的情况下，按照身高进行排序，也能大体得出体重的大小。这是现实生活中使用线性回归的例子。
在这个例子中，Y 是体重（因变量），x 是身高（自变量），a 和 b 分别为斜率和截距，可以通过最小二乘法获得。
身高体重
准备数据
自己伪造了一些数据
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
import matplotlib.pyplot as plt
def runplt():
    plt.figure()
    plt.title(u'Height-Weight')
    plt.xlabel(u'Height')
    plt.ylabel(u'Weight')
    plt.axis([150, 190, 40, 90])
    plt.grid(True)
    return plt

plt = runplt()
x = [[155], [157], [166], [177], [187]]
y = [[55], [60], [63], [70], [79]]
plt.plot(x, y, 'k.')
plt.show()
创建并拟合模型
1
2
3
4
5
6
from sklearn.linear_model import LinearRegression
import numpy as np
# 创建并拟合模型
model = LinearRegression()
model.fit(x, y)
print('预测身高180同学的体重：$%.2f' % model.predict(np.array([180]).reshape(-1, 1))[0])
上述代码中 sklearn.linear_model.LinearRegression 类是一个估计器（estimator）。估计器依据观测值来预测结果。在 scikit-learn 里面，所有的估计器都带有:
fit()
predict()
fit() 用来分析模型参数，predict() 是通过 fit()算出的模型参数构成的模型，对解释变量进行预测获得的值。
因为所有的估计器都有这两种方法，所有 scikit-learn 很容易实现不同的模型。
线性回归分类
线性回归的两种主要类型是一元线性回归和多元线性回归。一元线性回归的特点是只有一个自变量。多元线性回归则存在多个自变量。找最佳拟合直线的时候，你可以拟合到多项或者曲线回归。这些就被叫做多项或曲线回归。
一元线性回归
一元线性回归模型是 Y= a*x + b，求解一元线性回归模型的本质就是求解参数 a 和 b 的过程，最常用的方法为最小二乘法。
残差预测值
模型的残差是训练样本点与线性回归模型的纵向距离
1
2
3
4
5
6
7
# 残差预测值
y2 = model.predict(x)
plt.plot(x, y, 'k.')
plt.plot(x, y2, 'g-')
for idx, x in enumerate(x):
    plt.plot([x, x], [y[idx], y2[idx]], 'r-')
plt.show()
如图所示：
我们可以通过残差之和最小化实现最佳拟合，也就是说模型预测的值与训练集的数据最接近就是最佳拟合。对模型的拟合度进行评估的函数称为残差平方和（residual sum of squares）成本函数。就是让所有训练数据与模型的残差的平方之和最小化，如下所示：
其中， yi 是观测值， f(xi)f(xi) 是预测值。
1
2
import numpy as np
print('残差平方和: %.2f' % np.mean((model.predict(x) - y) ** 2))
残差平方和: 2.05
模型评估
使用线性回归得出模型后，我们可以用 R 方（r-squared）评估模型的效果。R方也叫确定系数（coefficient of determination），表示模型对现实数据拟合的程度。
一元线性回归中R方等于皮尔逊积矩相关系数（Pearson product moment correlation coefficient或Pearson’s r）的平方。这种方法计算的R方一定介于0～1之间的正数。其他计算方法，包括scikit-learn中的方法，不是用皮尔逊积矩相关系数的平方计算的，因此当模型拟合效果很差的时候R方会是负值。
LinearRegression的score方法可以计算R方
1
2
3
4
## 测试集
x_test = [[156], [163], [166], [170], [188]]
y_test = [[56], [63], [63], [72], [80]]
print('R方： ', model.score(x_test, y_test))
R 方：  0.898422638707
R 方是 0.898 说明测试集里面大多数的数据都可以通过模型解释
多元回归
多元回归即存在多个自变量，比如影响体重的因素不仅仅有身高，还有胸围，假设 x 中的第一个参数为身高，第二个参数为胸围。
1
2
3
4
5
6
7
8
9
10
11
12
13
from sklearn.linear_model import LinearRegression
## 伪造数据
x = [[155, 80], [157, 82], [166, 85], [177, 90], [187, 97]]
y = [[55], [60], [63], [70], [79]]
model = LinearRegression()
model.fit(x, y)
## 伪造测试集
x_test = [[156, 80], [163, 83], [166, 84], [170, 87], [188, 99]]
y_test = [[56], [63], [63], [72], [80]]
predictions = model.predict(x_test)
for i, prediction in enumerate(predictions):
    print('Predicted: %.2f, Target: %s' % (prediction, y_test[i]))
print('R-squared: %.2f' % model.score(x_test, y_test))
Predicted: 56.05, Target: [56]
Predicted: 60.03, Target: [63]
Predicted: 61.30, Target: [63]
Predicted: 65.56, Target: [72]
Predicted: 82.42, Target: [80]
R-squared: 0.83
多项式回归
上面两个例中，都假设自变量和响应变量的关系是线性的。真实情况未必如此，现实世界中的曲线关系都是通过增加多项式实现的，其实现方式和多元线性回归类似。在 scikit-learn 中，我们使用 PolynomialFeatures 构建多项式回归模型。下面比较多项式回归和线性回归的区别。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
from sklearn.preprocessing import PolynomialFeatures
# 建立线性回归，并用训练的模型绘图
model = LinearRegression()
model.fit(x, y)
xx = np.linspace(150, 190, 100)
yy = model.predict(xx.reshape(xx.shape[0], 1))
plt = runplt()
plt.plot(x, y, 'k.')
plt.plot(xx, yy)
# degree=3表示多项式最高项为3
polynomial_featurizer = PolynomialFeatures(degree=3)
x_train_polynomial = polynomial_featurizer.fit_transform(x)
x_test_polynomial = polynomial_featurizer.transform(x_test)
model_polynomial = LinearRegression()
model_polynomial.fit(x_train_polynomial, y)
xx_polynomial = polynomial_featurizer.transform(xx.reshape(xx.shape[0], 1))
plt.plot(xx, model_polynomial.predict(xx_polynomial), 'r-')
plt.show()
# 输出结果
print(x)
print(x_train_polynomial)
print(x_test)
print(x_test_polynomial)
print('1 r-squared', model.score(x_test, y_test))
print('2 r-squared', model_polynomial.score(x_test_polynomial, y_test))
拟合过度
我们不断改变 polynomial_featurizer = PolynomialFeatures(degree=3) 中 degree 的参数，当 degree = 5 的时候曲线经过所有的点，这种情况就成为拟合过度（over-fitting）。当模型出现拟合过度的时候，并没有从输入和输出中推导出一般的规律，而是记忆训练集的结果，这样在测试集的测试效果就不好了。
代码地址


JavaScript 数据类型
2016-12-27T14:02:32.000Z
JavaScript 语言可以识别 7 中不同的数据类型，除 Object 外，其它均为基本数据类型，Object 为引用数据类型。
Undefined, 只有一个值，即特殊值 undefined，使用 var/let/const 声明但未初始化的值。
Null，只有一个值，即特殊值 null，null 值表示一个空对象指针。
Boolean，布尔型，true 和 false。
Number, 整数和浮点数。
String, 字符串，由零个或者多个 16 位 Unicode 字符串组成的字符序列。
Symbol, ES6 新增类型，它的实例是唯一且不可改变的。
Object, 一组数据和功能的集合。可以通过 new 加对象名称创建。
Undefined 类型
1
2
3
var message // 变量声明之后默认取得了 undefined 值
message == undefined // true
message === undefined // true
Null 类型
Null 类型只有一个值 null，null 表示一个空指针对象。
1
typeof null // "objec"
如果定义变量准备在将来保存对象，最好讲该变量初始化为 null，这样可以通过检查 null 来判断是否已经保存了一个对象的引用。
实际上，undefined 值派生自 null
1
2
null == undefined // true
null === undefined // false
null vs undefined
尽管 null 和 undefined 之间的相等操作符（==）返回 true，不过它们的用途完全不同，如前所述，无论什么情况下，没有必要把一个变量的值设为 undefined，而如果一个变量将来要保存对象，应该将其显式地设为 null。
Boolean 类型
对于任何数据类型，调用 Boolean() 函数，总是会返回一个 Boolean 值。
1
2
3
4
5
Boolean(0) // false
Boolean(NaN) // false
Boolean(null) // false
Boolean(undefined) // false
Boolean('/t') // false
Number 类型
(1) 整数：
1
2
3
4
5
var intNum = 55
var octalNum = 070 // 八进制的 56
var hexNum = 0xA // 十六进制的 10

+0 === -0 // true
(2) 浮点数：
1
2
3
4
3e-17 // 0.000...03

0.1 + 0.2 // 0.30000000000000004 浮点数最高精度为 17 位小数
0.1 + 0.2 === 0.3 // false
ECMAScript 最小数：Number.MIN_VALUE，在大多数浏览器中为 5e-324。
ECMAScript 最大数：Number.MAX_VALUE，在大多数浏览器中为 1.7976931348623157e+308。
如果计算超过 JavaScript 数值范围，会自动转为特殊的 Infinity 值，负数则为 -Infinity。Infinity 不能参与数值计算。通过 isFinite() 函数判断参数是否位于最大值和最小值之间。
1
2
1 / 0 // Infinity
isFinite(Number.MAX_VALUE + Number.MAX_VALUE) // false
(3) NaN （Not a Number）
NaN 用来表示本来要返回数值的操作数未返回数值的情况，避免抛出错误。
NaN 的设计有两个特点：
1.任何涉及 NaN 的操作都返回 NaN
2.NaN与任何值都不相等，包括 NaN 本身
1
2
3
0/0 // NaN
NaN/10 // NaN
NaN == NaN // false
针对这两个特点，ECMAScript 设计了 isNaN() 函数。这个函数帮助我们判断参数是否 “不是数值”。isNaN() 接受参数后，会尝试将这个值转换为数值，如果这个值不能被转换为数值，则返回 true。
1
2
3
4
5
isNaN(NaN) // true
isNaN(10) // false
isNaN('10') // false 可以转换为数值 10
isNaN('blue') // true 不能转换为数值
isNaN(true) // false 可以转换为数值 1
(4) 数值转换
Number() 函数转换规则如下：
1.如果是 Boolean 值，返回 1 或者 0。
2.数字直接返回。
3.null 返回 0。
4.undefined 返回 NaN。
5.字符串：如果是十进制整数，八进制整数或者十六进制整数返回十进制整数，空字符串返回 0，其它均返回 NaN。
6.如果是对象，调用对象的 valueOf() 方法，然后按照前面的转换规则转换，如果转换值为 NaN，则调用对象的 toString() 方法。
parseInt()
1
2
3
4
5
parseInt('1234blue') // 1234
parseInt('') // NaN
parseInt('0xA') // 10
parseInt(22.5) // 22
parseInt(070) // 56
parseInt() 解析八进制字面量的字符串时，ES3 和 ES5 存在区别，在 ES3 中 ‘070’ 被当做八进制字面量，ES5 则当做 ‘70’。
因此 parseInt 可以接收第二个参数，表示以多少进制解析第一个参数。
1
2
3
parseInt('0xAF', 16) // 175
parseInt('070') // 70
parseInt('070', 8) // 56
Symbol 类型
Symbol 是 ES6 新增的数据类型，用来解决对象中属性名重复的问题，Symbol 表示独一无二的值，通过 Symbol 函数生成。
1
2
3
4
5
6
7
8
9
10
11
12
Symbol("foo") !== Symbol("foo") // true
const foo = Symbol()
const bar = Symbol()
typeof foo === "symbol" // true
typeof bar === "symbol" // true
let obj = {}
obj[foo] = "foo"
obj[bar] = "bar"
JSON.stringify(obj) // {}
Object.keys(obj) // []
Object.getOwnPropertyNames(obj) // []
Object.getOwnPropertySymbols(obj) // [ foo, bar ]
Object 类型
Object 对象是一组数据和功能的集合。
1
2
var o = new Object()
var o = new Object
关于 Object 对象的详细内容，可以参考 深入学习JavaScript——Object对象 和 使用 Object.defineProperty 为对象定义属性。
如何判断数据类型
(1) typeof 操作符
typeof 操作符返回值一共有7种：number，boolean，symbol，string，object，undefined，function。
1
2
3
4
5
6
7
8
9
10
typeof '' // string 有效
typeof 1 // number 有效
typeof Symbol() // symbol 有效
typeof true //boolean 有效
typeof undefined //undefined 有效
typeof null //object 无效
typeof [] //object 无效
typeof new Function() // function 有效
typeof new Date() //object 无效
typeof new RegExp() //object 无效
对于基本类型，除 null 以外，均可以返回正确的结果。
对于引用类型，除 function 以外，一律返回 object 类型。
对于 null ，返回 object 类型。
对于 function 返回  function 类型。
(2) instanceof
instanceof 用来判断 A 是否为 B 的实例，需要注意的是，instanceof 检测的是原型。
可以理解为：
1
2
3
4
5
instanceof (A, B) {
  var L = A.__proto__
  var R = B.prototype
  return L === R    
}
1
2
3
4
5
6
7
8
9
10
[] instanceof Array // true
{} instanceof Object // true
new Date() instanceof Date // true

function A () {}
new A() instanceof A // true

[] instanceof Object // true
new Date() instanceof Object // true
new A() instanceof Object // true
[] 的 __proto__ 指向了 Array.prototype，而 Array.prototype.__proto__ 又指向了 Object.prototype，而 Object.prototype.__proto__ 指向了 null，因此 []、Array、Object 在内部形成了一条原型链。instanceof 只能用来判断两个对象是否属于实例关系，而不能判断一个对象实例具体属于哪种类型。
(3) constructor
当一个函数 F 被定义的时候，JS 引擎会自动帮其添加 prototype，并在 prototype 上添加一个 constructor 属性，并让其指向 F 的引用。
当实例化 F 的时候，var f = new F()，F 原型上的 constructor 传递到了 f 上，因此 f.constructor === F。
F 利用原型对象上的 constructor 引用了自身，当 F 作为构造函数来创建对象时，原型上的 constructor 就被遗传到了新创建的对象上， 从原型链角度讲，构造函数 F 就是新对象的类型。这样做的意义是，让新对象在诞生以后，就具有可追溯的数据类型。
1
2
3
4
5
6
7
8
9
''.constructor === String
(1).constructor === Number
new Number(1).constructor === Number
new Function().constructor === Function
new Date().constructor === Date
new Error().constructor === Error
[].constructor === Array
document.constructor === HTMLDocument
window.constructor === Window
利用 constructor 判断数据类型存在的问题：
null 和 undefined 是无效对象，因此没有 constructor 存在。
函数的 constructor 可以被重写，因此可能会出现判断错误。
(4) toString
toString() 是 Object 的原型方式，调用该方法，默认返回当前对象的 [[CLass]]，其格式为 [object Xxx]，其中 Xxx 就是对象的类型。
1
2
3
4
5
6
7
8
9
10
11
12
13
Object.prototype.toString.call('') // [object String]
Object.prototype.toString.call(1) // [object Number]
Object.prototype.toString.call(true) // [object Boolean]
Object.prototype.toString.call(Symbol()) //[object Symbol]
Object.prototype.toString.call(undefined) // [object Undefined]
Object.prototype.toString.call(null) // [object Null]
Object.prototype.toString.call(new Function()) // [object Function]
Object.prototype.toString.call(new Date()) // [object Date]
Object.prototype.toString.call([]) // [object Array]
Object.prototype.toString.call(new RegExp()) // [object RegExp]
Object.prototype.toString.call(new Error()) // [object Error]
Object.prototype.toString.call(document) // [object HTMLDocument]
Object.prototype.toString.call(window) // [object Window]
引用数据类型 vs 基本数据类型
基本数据类型复制相当于在内存中新开辟一块内存，引用数据类型的复制相当于在内存中创建了一个新的指针，指向存储在堆中的一个对象。
ECMAScript 中所有的函数都是 按值传递参数 的。也就是说，把函数外部的值复制给函数内部的参数，就和把值从一个变量复制到另外一个变量一样。
在向参数传递基本数据类型的值时，被传递的值会被复制给一个局部变量（即命名参数，也就是 arguments 对象中的一个元素）。在向参数传递引用类型的值时，会把这个值在内存中的地址复制给一个局部变量，因此这个局部变量的变化会反映在函数外部。
1
2
3
4
5
6
function setName (obj) {
  obj.name = 'Leo'
}
var person = new Object()
setName(person)
console.log(person.name) // "Leo"
参考资料
《JavaScript高级程序设计》
判断JS数据类型的4种方法
语法和数据类型


async 和 defer 的区别
2016-12-26T15:43:58.000Z
HTML 中的 （F12 打开控制台，点击查看效果）
如果点击子元素不想触发父元素的事件怎么办？
那就是停止事件传播—event.stopPropagation()
1
2
3
4
child.addEventListener('click', function(e){
  console.log('click-child')
  　e.stopPropagation()
}, false)
    DOM 事件        父元素          子元素    
  
  （F12 打开控制台，点击查看效果）事件捕获
修改上面事件冒泡的例子
1
2
3
4
5
6
7
8
9
10
11
12
13
14
let parent = document.getElementById('parent')
let child = document.getElementById('child')

parent.addEventListener('click', function(e) {
  console.log('click-parent---事件传播')
}, false)
// 新增事件捕获
parent.addEventListener('click', function(e) {
  console.log('click-parent--事件捕获')
}, true)

child.addEventListener('click', function(e) {
  console.log('click-child')
}, false)
    DOM 事件        父元素          子元素    
  
  （F12 打开控制台，点击查看效果）父元素通过事件捕获的方式注册了 click 事件，所以在事件捕获阶段就会触发，然后到了目标阶段，即事件源，之后进行事件传播，parent 同时也用冒泡方式注册了 click 事件，所以这里会触发冒泡事件，最后到根节点。这就是整个事件流程。
事件委托
事件委托(事件代理)：利用事件冒泡的特性，将里层的事件委托给外层事件，根据 event 对象的属性进行事件委托，改善性能。
使用事件委托能够避免对特定的每个节点添加事件监听器；事件监听器是被添加到它们的父元素上。事件监听器会分析从子元素冒泡上来的事件，找到是哪个子元素的事件。
委托在 JQuery 中已经得到了实现，即通过 $(selector).on(event,childSelector,data,function,map) 实现委托，一般用于动态生成的元素，当然 JQuery 也是通过原生的 js 去实现的，下面举一个简单的栗子，如果要单独点击 table 里面的 td，普通做法是 for 循环给每个 td 绑定事件，td 少的话性能什么差别，td 如果多了，就不行了，我们使用事件委托:
HTML
1
2
3
4
5
6
7
8
9
10
11
12
13
14
<table id="outside" border="1" style="cursor: pointer;">
<tr>
  <td>table01td>
  <td>table02td>
  <td>table03td>
  <td>table04td>
  <td>table05td>
  <td>table06td>
  <td>table07td>
  <td>table08td>
  <td>table09td>
  <td>table10td>
tr>
table>
JavaScript
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
let out = document.getElementById('outside')
if (out.addEventListener) {
  out.addEventListener('click', function(e) {
    e = e || window.event
    // IE没有e.target，有e.srcElement
    let target = e.target || e.srcElement
    // 判断事件目标是否是td，是的话target即为目标节点td
    if (target.tagName.toLowerCase() == 'td') {
      changeStyle(target)
      console.log(target.innerHTML)
    }
  }, false)
} else {
  out.attachEvent('onclick', function(e) {
    e = e || window.event
    // IE没有e.target，有e.srcElement
    let target = e.target || e.srcElement
    // 判断事件目标是否是td，是的话target即为目标节点td
    if (target.tagName.toLowerCase() == 'td') {
      changeStyle(target)
      console.log(target.innerHTML)
    }
  })
}

function changeStyle(ele) {
  ele.innerHTML = '已点击'
  ele.style.background = '#900'
  ele.style.color = '#fff'
}
    DOM 事件        table01     table02     table03     table04     table05     table06     table07     table08     table09     table10   
  
  （点击查看效果）总结
事件的三个阶段分别为：捕获，目标和冒泡，低版本 IE 不支持捕获。绑定事件的方法为 addEventListener 和 attachEvent。addEventListener 方法的第三个 boolean 型参数表示添加的事件为捕获或者冒泡，true 代表捕获，false 代表冒泡。
事件冒泡的优点为：
可以大量节省内存占用，减少事件注册，比如在 table 上代理所有 td 的 click 事件。
可以实现为动态增加的 DOM 绑定事件的功能。


JavaScript 中 的 DOM 和 BOM
2016-12-24T13:23:25.000Z
JavaScript 与 ECMAScript 关系
JavaScript = ECMAScript + DOM + BOM
1.ECMAScript 为 JavaScript 提供核心语言功能，是由欧洲计算机制造商协会（ECMA）39号技术委员会（TC39）制定的一种通用、跨平台、供应商中立的脚本语言和语义。ECMAScript 是一种由 ECMA 组织通过 ECMA-262 标准化的脚本程序设计语言。ECMA-262 标准没有参考 Web 浏览器，它规定了语言的语法、类型、语句、关键字、保留字、操作符、对象。
2.DOM (文档对象模型) 是针对 XML 但是经过扩展用于 HTML 的应用程序编程接口（API）。DOM 把 HTML 页面映射为一个多层节点结构，开发人员借助 DOM 提供的 API，可以轻松地删除，添加，替换或者修改节点。
3.BOM（浏览器对象模型）指的是由 Web 浏览器暴露的所有对象组成的表示模型。从根本上将 BOM 只处理浏览器窗口和框架，但是人们习惯把针对浏览器的 JavaScript 扩展也算作 BOM 的一部分，例如：浏览器弹出新窗口的功能；移动、缩放和关闭浏览器窗口的功能；navigator 对象；location 对象； screen 对象；cookies 支持；XMLHttpRequest 和 IE 的 ActiveXObject 对象。BOM 直到 HTML5 才有了规范可以遵守，在此之前每个浏览器都有自己不同的实现。
DOM 级别
DOM1 级由两个模块组成，DOM 核心（DOM Core）和 DOM HTML。其中，DOM Core 规定如何映射基于 XML 的文档结构，DOM HTML 模块则在 DOM Core 基础上加以扩展，添加了针对 HTML 的对象和方法。
DOM2 在原有的 DOM 基础上又扩充了鼠标和用户界面事件、范围、遍历（迭代 DOM 文档的方法）等细分模块，并且通过对象接口增加了对 CSS 的支持。DOM2 级引入的模块有：
- DOM 视图（DOM Views）：定义了追踪不同文档的视图接口。
- DOM 事件（DOM Events）：定义了事件和事件处理的接口。
- DOM 样式（DOM Style）：定义了基于 CSS 为元素样式的接口。
- DOM 遍历和范围（DOM Traversal and Range）：定义了遍历和操作文档树的接口。
DOM3 级进一步扩展 DOM，引入了以统一方式加载和保存文档的方法——在 DOM 加载和保存（DOM Load and Save）模块中定义，新增了 DOM 验证（DOM Validation）。DOM3 级也对 DOM Core 进行了扩展，开始支持 XML 1.0 规范。
DOM0 级，DOM0 级标准本质上不存在，所谓 DOM0 只是 DOM 历史坐标中的一个参照点，具体来说，DOM0 级是指 Internet Explorer 4.0 和 Netscape Navigator 4.0 最初支持的 DHTML。
可以通过以下代码确定浏览器是否支持 DOM 模块：
1
2
3
4
5
var supportsDOM2Core = document.implementation.hasFeature('core', '2.0')
var supportsDOM3Core = document.implementation.hasFeature('core', '3.0')
var supportsDOM2HTML = document.implementation.hasFeature('HTML', '2.0')
var supportsDOM2Views = document.implementation.hasFeature('Views', '2.0')
var supportsDOM2XML =  document.implementation.hasFeature('XML', '2.0')



Angular 双向绑定实现原理
2016-12-19T21:33:09.000Z
从一个 demo 讲起
用 Angular + socket.io 做了一个聊天 demo，消息通信没有问题，在 Angular 数据绑定的地方却栽了跟头：明明 model 已经发生了改变，在视图上就是看不到更新。
后来仔细研究，通过使用 “$scope.$apply()” 解决了这个问题。
之前对 Angular 数据双向绑定只有一个大概的印象，并没有深入地了解，正好趁这个机会好好学习一下数据绑定的过程。
简化代码
服务端代码：
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
'use strict';
let express = require('express');
let app = express();
let http = require('http').Server(app);
let io = require('socket.io')(http);
let path = require('path');

app.use(express.static(path.join(__dirname, 'public')));
app.get('/', function (req, res) {
    res.sendFile(__dirname + '/index.html');
});
io.on('connection', function(socket){
    // 接收事件
    socket.on('chat message', function(msg){
        console.log(msg);
        // 发送事件
        io.emit('chat message', msg);
    });
});
http.listen(3000, function () {
    console.log('listening on :3000');
});
客户端代码：
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
html>
<html ng-app="chatApp">
<head>
    <title>Socket.IO demotitle>
    <link rel="stylesheet" type="text/css" href="style.css">
    <script src="https://ajax.googleapis.com/ajax/libs/angularjs/1.6.0/angular.min.js">script>
    <script src="/socket.io/socket.io.js">script>
    <script src="main.js">script>
head>
<body ng-controller="ChatController">
<ul id="messages">
    <li ng-repeat="item in chatMessage">{{item}}li>
ul>
<form ng-submit="submit()">
    <input input id="m" ng-model="chatInput" autocomplete="off"/>
    <button>Sendbutton>
form>
body>
html>
CSS 代码略。
JavaScript 代码:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
'use strict';
angular.module('chatApp', [])
    .controller('ChatController', ['$scope', function ($scope) {
        let socket = io();
        $scope.chatMessage = [];
        // 接收事件
        socket.on('chat message', function (msg) {
            $scope.chatMessage.push(msg);
        });

        $scope.submit = function () {
            //发送事件
            socket.emit('chat message', $scope.chatInput);
            $scope.chatInput = '';
        };
    }]);
完整demo地址
socket.io 通过 socket.emit() 发送事件，通过 socket.on() 监听事件。
上面代码似乎没有什么问题，可是运行的时候总是发生视图不更新的情况。
debug 发现 $scope.chatMessage 的值已经发生改变了，按理说 Angular 的 model 与 view 是双向绑定的，model 改变 view 也应该随之更新才对啊，为什么会出现这种情况呢？
分析
$scope.chatMessage 发生变化后，没有强制 $digest 循环，监视 chatMessage 的 $watch 没有执行，而我们自己执行一次 $apply，那么这些 $watch 就会看见这些变化，然后根据需要更新 DOM。


跨域实践
2016-12-16T01:04:17.000Z
背景
最近在 ITA 写了一个聊天机器人的 Flask 服务，自己写了一些 node 单元测试脚本跑没有问题，但是测试的同学也想覆盖到所有的 case，于是就帮忙写一个 html 页面去测试，然后就遇到了下面的问题：
XMLHttpRequest cannot load http://localhost:8085/predict. No ‘Access-Control-Allow-Origin’ header is present on the requested resource. Origin ‘null’ is therefore not allowed access.
这个是典型的跨域问题(跨域是指：协议、域名、端口有任何一个不同，都被当做是不同的域)，想想之前也了解过跨域的知识，现在借着这个机会总结一下了。关于 GET 请求的跨域，使用 JSONP 是目前最好的解决方案，各大浏览器也基本都支持 JSONP，而 jQuery，AngularJS 等前端框架也都默认添加了对 JSONP 的封装，并且这次遇到的跨域问题是 POST 请求的，于是暂时先不写关于 JSONP 的相关知识。
简化代码
服务器代码:
1
2
3
4
5
6
7
8
9
from flask import Flask
if __name__ == "__main__":
    print('Start server')
    app = Flask(__name__)
    # 路由
    @app.route('/predict', methods=['POST'])
    def predict():
        return 'result'
    app.run(host='0.0.0.0', port=8085, debug=True)
页面代码：
1
2
3
4
5
6
7
8
9
10
11
12
13
14
html>
<html ng-app="chatApp">
<head>
    <script src="https://ajax.googleapis.com/ajax/libs/angularjs/1.6.0/angular.min.js">script>
    <script src="./main.js">script>
head>
<body>
    <div ng-controller="ChatController">
        <input type="text" ng-model="chat" placeholder="Enter content here">
        <button ng-click="onclick()">POSTbutton>
        <p> {{ result }} p>
    div>
body>
html>
– 原谅我用 Angular 做页面 ☹
main.js
1
2
3
4
5
6
7
8
9
10
11
angular.module('chatApp', [])
    .controller('ChatController', ['$scope', '$http', function($scope, $http) {
        $scope.onclick = function() {
            $http({
                method: 'POST',
                url: 'http://localhost:8085/predict'
            }).then((data) => {
                $scope.result = data;
            });
        };
    }]);
解决方案
要想解决跨域，必先理解跨域。那什么是跨域呢？
对于 web 开发来讲，由于浏览器的同源策略，我们需要经常使用一些 hack 的方法去跨域获取资源，直到 W3C 出了一个标准－CORS－“跨域资源共享”（Cross-origin resource sharing），
它允许浏览器向跨源服务器，发出 XMLHttpRequest 请求，从而克服了 AJAX 只能同源使用的限制。
CORS 与 JSONP 的使用目的相同，但是比 JSONP 更强大。
JSONP 只支持 GET 请求，CORS 支持所有类型的 HTTP 请求。JSONP 的优势在于支持老式浏览器，以及可以向不支持 CORS 的网站请求数据。
CORS 解决方案：
(1) 服务器代码
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
from flask import Flask, Response, request
if __name__ == "__main__":
    print('Start server')
    app = Flask(__name__)
    # post
    @app.route('/predict', methods=['POST'])
    def predict():
        if request.form.get('content') is None:
            exp = 'Missing content'
        else:
            exp = request.form.get('content')
        print(exp)
        headers = {"Access-Control-Allow-Origin": "*"}
        return Response(exp, headers=headers)
    # port=8085
    app.run(host='0.0.0.0', port=8085, debug=True)
(2) main.js
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
angular.module('chatApp', [])
    .controller('ChatController', ['$scope', '$http', function($scope, $http) {
        $scope.onclick = function() {
            $http({
                method: 'POST',
                url: 'http://localhost:8085/predict',
                headers: {
                    'Content-Type': 'application/x-www-form-urlencoded'
                },
                data: 'content= ' + $scope.chat

            }).then((data) => {
                $scope.result = data.data;
            });
        };
    }]);
此时再次发送 Ajax call就可以拿到结果了:
注意到服务器端代码发生了一点改动，那就是在Response header中增加了一个参数 “Access-Control-Allow-Origin”，表示接受某域名的请求，“*” 表示允许所有的请求。
也可以使用确定的值，如： “http://api.abc.com”。
于是代码中增加 headers = {“Access-Control-Allow-Origin”: ""}* 后服务器就可以响应所有的请求了。
再看 Web 端的代码，我们在请求头里面添加了 “Content-Type”，为了能向服务端传递数据。这里使用的 “Content-Type” 为 “application/x-www-form-urlencoded” 表示以表单提交的形式传递参数。
为什么要用表单的形式提交POST请求呢？
两种请求
浏览器将 CORS 请求分成两类：简单请求（simple request）和非简单请求（not-so-simple request）。
只要同时满足以下两大条件，就属于简单请求。
(1) 请求方法是以下三种方法中的一个：
HEAD
GET
POST
(2) HTTP的头信息不超出以下几种字段：
Accept
Accept-Language
Content-Language
Last-Event-ID
Content-Type  其值仅限于 application/x-www-form-urlencoded、multipart/form-data、text/plain
上文中的请求属于简单请求。
简单请求（simple request）
对于简单的跨域请求，浏览器会自动在请求的头信息加上 Origin 字段，表示本次请求来自哪个源（协议 + 域名 + 端口），服务端会获取到这个值，然后判断是否同意这次请求并返回。
// 请求
GET /cors HTTP/1.1
Origin: http://api.abc.com
Host: api.bcd.com
Accept-Language: en-US
Connection: keep-alive
User-Agent: Mozilla/5.0…
如果服务端许可本次请求，就会在返回的头信息多出关于 Access-Control 的信息，比如上述服务器返回的信息：
非简单请求（not-so-simple request）
非简单请求是那种对服务器有特殊要求的请求，比如请求方法是 PUT 或 DELETE，或者 Content-Type 字段的类型是 application/json。
非简单请求的 CORS 请求，会在正式通信之前，增加一次 HTTP 查询请求，称为“预检”请求（preflight）。
浏览器先询问服务器，当前网页所在的域名是否在服务器的许可名单之中，以及可以使用哪些 HTTP 动词和头信息字段。只有得到肯定答复，浏览器才会发出正式的 XMLHttpRequest 请求，否则就报错。
“预检”请求用的请求方法是 OPTIONS，表示这个请求是用来询问的。头信息里面，关键字段是Origin，表示请求来自哪个源。
非简单请求解决方案
项目中使用的 Content-Type 为 application/json，属于非简单请求，将上述程序修改为
(1) main.js:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
angular.module('chatApp', [])
    .controller('ChatController', ['$scope', '$http', function($scope, $http) {
        $scope.onclick = function() {
            $http({
                method: 'POST',
                url: 'http://localhost:8086/predict',
                headers: {
                    'Content-Type': 'application/json'
                },
                data: JSON.stringify({
                    'content': $scope.chat
                })
            }).then((data) => {
                $scope.result = data.data;
            });
        };
    }]);
服务器代码：
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
from flask import Flask, Response, request

if __name__ == "__main__":
    print('Start server')
    app = Flask(__name__)
    # 路由
    @app.route('/predict', methods=['POST', 'OPTIONS'])
    def predict():
    # 返回头
        headers = {"Access-Control-Allow-Origin": "*",
                   "Access-Control-Allow-Headers": "Origin, X-Requested-With, Content-Type",
                   "Access-Control-Allow-Methods": "POST, PUT, GET, OPTIONS, DELETE"}
        # preflight
        if request.method == 'OPTIONS':
            return Response(headers=headers)
        # request
        if 'content' in request.json:
            exp = request.json.get('content')
        else:
            exp = 'Missing content'
        print(exp)
        return Response(exp, headers=headers)
    # run server
    app.run(host='0.0.0.0', port=8086, debug=True)
启动后发送请求，发现可以跑通，但是获取不到参数，原因是使用 application/json 的形式发送 request， 参数并没有放在 form 里面，而是放在 request.data 里面了。
request.data 里面为 bytes 类型的数据，通过 request.json 可以获取其 dict 类型。
通过以上方式，完美地解决了复杂请求的跨域问题。
才怪嘞！！！♋
问题所在
以上解决跨域的方式为 CORS，准确地说，这是一种服务器端的技术。而现实生产环境中，如果一个前端想要用这种方式实现跨域，不知道要跟后端做多少沟通，那有没有纯前端的解决方案呢？
且听下回分解。☛


Pandas 数据处理学习
2016-12-07T21:07:46.000Z
10分钟 Pandas 入门
Pandas 是 Python 做数据分析最重要的模块之一，本文源自Pandas 作者 Wes McKinney 写的 10-minute tour of pandas。
首先安装 Pandas 和相关的两个包 numpy、matplotlib
1
2
3
pip install pandas
pip install numpy
pip install matplotlib
导入 pandas、numpy、matplotlib
1
2
3
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
对象创建
Series 是一个序列，使用 Pandas 创建一个整数索引的序列：
1
2
3
4
5
6
7
8
9
>>> s = pd.Series([1,3,5,np.nan,6,8])
>>> s
0    1.0
1    3.0
2    5.0
3    NaN
4    6.0
5    8.0
dtype: float64
DataFrame 是有多个列的数据表，每个列拥有一个 label，当然，DataFrame 也有索引:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
>>> dates = pd.date_range('20170101', periods=6)
>>> dates
DatetimeIndex(['2017-01-01', '2017-01-02', '2017-01-03', '2017-01-04',
               '2017-01-05', '2017-01-06'],
              dtype='datetime64[ns]', freq='D')
>>> df = pd.DataFrame(np.random.randn(6,4), index=dates, columns=list('ABCD'))
>>> >>> df.shape
(6, 5)
>>> df
                   A         B         C         D
2017-01-01  0.147072  1.235226  0.143952  0.831411
2017-01-02  0.862293 -0.725103 -0.104664  1.265863
2017-01-03  0.281511  0.956868 -0.741193  0.129071
2017-01-04 -0.664475  0.965653  1.522392  1.129707
2017-01-05 -1.364532 -0.167877  0.078448  0.217550
2017-01-06  0.717721  0.344734 -0.951364  0.362032
通过一个对象字典创建 DataFrame， dict 的每个 value 会被转化成一个 Series：
1
2
3
4
5
6
7
8
9
10
11
12
>>> df2 = pd.DataFrame({ 'A' : 1., 
>>>  'B' : pd.Timestamp('20170102'), 
>>>  'C' : pd.Series(1,index=list(range(4)),dtype='float32'), 
>>>  'D' : np.array([3] * 4,dtype='int32'), 
>>>  'E' : pd.Categorical(["test","train","test","train"]), 
>>>  'F' : 'foo' })
>>> df2
     A          B    C  D      E    F
0  1.0 2017-01-02  1.0  3   test  foo
1  1.0 2017-01-02  1.0  3  train  foo
2  1.0 2017-01-02  1.0  3   test  foo
3  1.0 2017-01-02  1.0  3  train  foo
查看每列的格式：
1
2
3
4
5
6
7
8
>>> df2.dtypes
A           float64
B    datetime64[ns]
C           float32
D             int32
E          category
F            object
dtype: object
查看某一列的具体值
1
2
3
4
5
6
>>> df2.C
0    1.0
1    1.0
2    1.0
3    1.0
Name: C, dtype: float32
查看数据
使用 head() 查看 DataFrame 前几行； tail() 查看后几行：
1
2
3
4
5
6
7
8
9
10
>>> df.head(3)
                   A         B         C         D
2017-01-01  0.147072  1.235226  0.143952  0.831411
2017-01-02  0.862293 -0.725103 -0.104664  1.265863
2017-01-03  0.281511  0.956868 -0.741193  0.129071
>>> df.tail(3)
                   A         B         C         D
2017-01-04 -0.664475  0.965653  1.522392  1.129707
2017-01-05 -1.364532 -0.167877  0.078448  0.217550
2017-01-06  0.717721  0.344734 -0.951364  0.362032
实际上，DataFrame 内部用 numpy 格式存储数据。你也可以单独查看 index、columns 和 values：
1
2
3
4
5
6
7
8
9
10
11
12
13
>>> df.index
DatetimeIndex(['2017-01-01', '2017-01-02', '2017-01-03', '2017-01-04',
               '2017-01-05', '2017-01-06'],
              dtype='datetime64[ns]', freq='D')
>>> df.columns
Index(['A', 'B', 'C', 'D'], dtype='object')
>>> df.values
array([[ 0.14707226,  1.23522557,  0.14395236,  0.83141137],
       [ 0.86229302, -0.72510256, -0.10466379,  1.26586314],
       [ 0.28151127,  0.95686785, -0.74119266,  0.12907115],
       [-0.66447533,  0.96565318,  1.52239163,  1.12970702],
       [-1.36453175, -0.16787707,  0.07844812,  0.21755034],
       [ 0.71772123,  0.34473429, -0.95136372,  0.36203183]])
使用 describe() 可以帮你做一些数据的概要
1
2
3
4
5
6
7
8
9
10
>>> df.describe()
              A         B         C         D
count  6.000000  6.000000  6.000000  6.000000
mean  -0.003402  0.434917 -0.008738  0.655939
std    0.855916  0.763118  0.872870  0.486500
min   -1.364532 -0.725103 -0.951364  0.129071
25%   -0.461588 -0.039724 -0.582060  0.253671
50%    0.214292  0.650801 -0.013108  0.596722
75%    0.608669  0.963457  0.127576  1.055133
max    0.862293  1.235226  1.522392  1.265863
DataFrame 的矩阵转置
1
>>> df.T
DataFrame 排序
（1） 使用 sort_index 按照索引排序
ascending 参数默认值为 True
axis = 0 指的是安装行排序，axis = 1 是指安装列排序：
1
>>> df.sort_index(axis=1, ascending=False)
（2） 使用 sort_values 按照值排序
1
>>> df.sort_values(by='B', ascending=False)
选择
行/列
选择单独的列：
1
2
>>> df['A']
>>> df.A
切片，使用[]选择特定的行
1
2
3
4
5
>>> df[0:3]
                   A         B         C         D
2017-01-01  0.147072  1.235226  0.143952  0.831411
2017-01-02  0.862293 -0.725103 -0.104664  1.265863
2017-01-03  0.281511  0.956868 -0.741193  0.129071
通过 label 选择
通过 label 选择(dates[0]=Timestamp(‘2017-01-01 00:00:00’, offset=‘D’))
1
2
3
4
5
>>> df.loc[dates[0]]
A    0.147072
B    1.235226
C    0.143952
D    0.831411
多选，「A：B」 表示从 A 到 B
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
>>> df.loc[:,['A','B']]
                   A         B
2017-01-01  0.147072  1.235226
2017-01-02  0.862293 -0.725103
2017-01-03  0.281511  0.956868
2017-01-04 -0.664475  0.965653
2017-01-05 -1.364532 -0.167877
2017-01-06  0.717721  0.344734
>>> df.loc['20170102':'20170104',['A','B']]
                   A         B
2017-01-02  0.862293 -0.725103
2017-01-03  0.281511  0.956868
2017-01-04 -0.664475  0.965653
>>> df.loc['20170102',['A','B']]
A    0.862293
B   -0.725103
Name: 2017-01-02 00:00:00, dtype: float64
>>> df.at[dates[0],'A']
0.14707225966646126
通过下标选择
选择第四行所有元素
1
2
3
4
5
>>> df.iloc[3]
A   -0.664475
B    0.965653
C    1.522392
D    1.129707
选出3_4行，01列
1
2
3
4
>>> df.iloc[3:5,0:2]
                   A         B
2017-01-04 -0.664475  0.965653
2017-01-05 -1.364532 -0.167877
选择单个元素
1
2
>>> df.iloc[1,1]
>>> df.iat[1,1]
比较运算
1
2
3
4
5
6
>>> df[df.A > 0]
                   A         B         C         D
2017-01-01  0.147072  1.235226  0.143952  0.831411
2017-01-02  0.862293 -0.725103 -0.104664  1.265863
2017-01-03  0.281511  0.956868 -0.741193  0.129071
2017-01-06  0.717721  0.344734 -0.951364  0.362032
选出大于0 的全部元素，没有填充的值等于 NaN
1
2
3
4
5
6
7
8
>>> df[df > 0]
                   A         B         C         D
2017-01-01  0.147072  1.235226  0.143952  0.831411
2017-01-02  0.862293       NaN       NaN  1.265863
2017-01-03  0.281511  0.956868       NaN  0.129071
2017-01-04       NaN  0.965653  1.522392  1.129707
2017-01-05       NaN       NaN  0.078448  0.217550
2017-01-06  0.717721  0.344734       NaN  0.362032
isin() 函数：是否在集合中
1
2
3
4
5
6
7
8
9
10
11
12
13
14
>>> df2 = df.copy()
>>> df2['E'] = ['one', 'one','two','three','four','three']
>>> df2
                   A         B         C         D      E
2017-01-01  0.147072  1.235226  0.143952  0.831411    one
2017-01-02  0.862293 -0.725103 -0.104664  1.265863    one
2017-01-03  0.281511  0.956868 -0.741193  0.129071    two
2017-01-04 -0.664475  0.965653  1.522392  1.129707  three
2017-01-05 -1.364532 -0.167877  0.078448  0.217550   four
2017-01-06  0.717721  0.344734 -0.951364  0.362032  three
>>> df2[df2['E'].isin(['two','four'])]
                   A         B         C         D     E
2017-01-03  0.281511  0.956868 -0.741193  0.129071   two
2017-01-05 -1.364532 -0.167877  0.078448  0.217550  four
设置
按照 index 给 DataFrame 添加新的列：
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
>>> s1 = pd.Series([1,2,3,4,5,6], index=pd.date_range('20170102', periods=6))
>>> s1
2017-01-02    1
2017-01-03    2
2017-01-04    3
2017-01-05    4
2017-01-06    5
2017-01-07    6
Freq: D, dtype: int64
>>> df['F'] = s1
>>> df
                   A         B         C         D    F
2017-01-01  0.147072  1.235226  0.143952  0.831411  NaN
2017-01-02  0.862293 -0.725103 -0.104664  1.265863  1.0
2017-01-03  0.281511  0.956868 -0.741193  0.129071  2.0
2017-01-04 -0.664475  0.965653  1.522392  1.129707  3.0
2017-01-05 -1.364532 -0.167877  0.078448  0.217550  4.0
2017-01-06  0.717721  0.344734 -0.951364  0.362032  5.0
通过 label 设置
1
2
3
4
5
6
7
8
>>> df.at[dates[0],'A'] = 0  
>>> df['A']
2017-01-01    0.000000
2017-01-02    0.862293
2017-01-03    0.281511
2017-01-04   -0.664475
2017-01-05   -1.364532
2017-01-06    0.717721
通过下标设置
1
>>> df.iat[0,1] = 0
用 numpy 数组设置
1
2
3
4
5
6
7
8
>>> df.loc[:,'D'] = np.array([5] * len(df))
>>> df.D
2017-01-01    5
2017-01-02    5
2017-01-03    5
2017-01-04    5
2017-01-05    5
2017-01-06    5
使用比较设置
1
2
3
4
5
6
7
8
9
10
>>> df2 = df.copy()
>>> df2[df2 > 0] = -df2
>>> df2
                   A         B         C  D    F
2017-01-01  0.000000 -1.000000 -0.143952 -5  NaN
2017-01-02 -0.862293 -0.725103 -0.104664 -5 -1.0
2017-01-03 -0.281511 -0.956868 -0.741193 -5 -2.0
2017-01-04 -0.664475 -0.965653 -1.522392 -5 -3.0
2017-01-05 -1.364532 -0.167877 -0.078448 -5 -4.0
2017-01-06 -0.717721 -0.344734 -0.951364 -5 -5.0



深入学习 JavaScript——继承
2016-12-05T23:50:08.000Z
继承
继承是面向对象语言中最重要的概念之一，许多 OO 语言都支持两种继承方式：接口继承和实现继承。接口继承只继承方法签名，而实现继承则继承实际的方法。由于 ECMAScript 中没有方法签名，所以不能实现接口继承，而是通过原型链的方式完成实现继承。
原型链
每个构造函数都有一个原型对象，原型对象包含一个指向构造函数的指针，而所有实例中都包含一个指向原型对象的内部指针。下面是一个实现原型链的基本方法：
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
function SuperType() {
  this.property = true
}
SuperType.prototype.getSuperValue = function() {
  return this.property
}
function SubType() {
  this.subProperty = false
}
// 继承了 SuperType
SubType.prototype = new SuperType()
SubType.prototype.getSubValue = function() {
  return this.subProperty
}
let instance = new SubType()
console.log(instance.getSuperValue()) // true
上述代码定义了 SuperType 和 SubType 两种类型，每个类型分别有一个属性和一个方法，SubType 通过改写原型对象的方式实现对 SuperType 的继承。原来存在于 SuperType 中的属性和方法，现在也存在于 SubType.prototype 中。在确立了继承关系后，我们给 SubType.prototype 又添加了一个新方法，这个例子中的关系图如下：
在上述代码中，我们修改 SubType 默认的原型为 SuperType 的实例，新原型不仅具有作为一个 SuperType 的实例所拥有的全部属性和方法，而且其内部还有一个指针，指向了 SuperType 的原型。最终的结果是这样的：instance 指向了 SubType 的原型，SubType 的原型又指向了 SuperType 的原型。
1
2
3
instance.__proto__ === SubType.prototype // true
SubType.prototype.__proto__ === SuperType.prototype //true
instance.__proto__.__proto__ === SuperType.prototype //true



深入学习 JavaScript——理解原型
2016-12-02T13:21:53.000Z
理解原型对象
在 JavaScript 中，只要创建了新函数，都会根据一组特定的规则为该函数创建一个 prototype 属性，这个属性指向函数的原型对象。默认情况下，所有原型对象都会自动获取一个 constructor（构造函数）属性，这个属性包含一个指向 prototype 属性所在函数的指针。比如：
1
2
function Person () {}
Person.prototype.constructor === Person
通过 constructor，我们可以继续为原型对象添加其他属性和方法。
创建自定义的构造函数之后，其原型对象默认只会取得 constructor 属性，其它属性和方法都是从 Object 继承而来的。
当调用构造函数创建一个新实例后，该实例的内部将包含一个指针（[[Prototype]]），指向构造函数的原型对象，该指针在常用的浏览器中被定义为 __proto__。需要说明的一点是，该连接存在于实例和构造函数的原型对象之间，而不是存在于原型和构造函数之间。
1
2
let leo = new Person()
leo.__proto__ === Person.prototype
关系
构造函数，实例，prototype，__proto__ 之间的关系可以理解为下图：
注意：__proto__ 并非 JS 标准属性，而是浏览器的实现。
从图中可以看出构造函数 Person 和实例 leo 之间并没有直接关系，而是通过 Person.prototype 原型对象进行关联。虽然实例中并不包含属性和方法，但是可以通过调用 leo.sayName 进行调用。在非浏览器环境或者浏览器不支持 __proto__ 的环境中，我们可以通过 isPrototypeOf() 方法来确定对象之间是否存在这种关系。
1
2
Person.prototype.isPrototypeOf(leo) // true
leo.__proto__ === Person.prototype // 一些浏览器可能不支持
ECMAScript5 中增加了 Object.getPrototypeOf() 方法，该方法返回 [[Prototype]] 的值。
1
Object.getPrototypeOf(leo) === Person.prototype
每当代码读取某个对象的属性时，都会执行一次搜索：首先判断实例是否具有给定名字的属性，如果没有的话，继续搜索实例的原型对象。
原型对象中的属性对于实例来说是只读的，比如：
1
2
3
4
5
6
7
8
9
function Person () {}
Person.prototype.name = 'JavaScript'
let p1 = new Person()
let p2 = new Person()
p1.name = 'CSS'
console.log(p1.name) // CSS
console.log(p2.name) // JavaScript
delete p1.name
console.log(p1.name) // JavaScript
hasOwnProperty() 与 in 操作符
hasOwnProperty 可以检测一个属性是存在于实例中，还是存在于原型对象中，这个方法继承自 Object 对象；无论属性存在于实例中还是原型中，使用 in 操作符都能得到 true。
1
2
3
4
5
6
7
8
function Person () {}
Person.prototype.name = 'JavaScript'
let p1 = new Person()
p1.hasOwnProperty('name') // false
console.log('name' in p1) // true
p1.name = 'nobody'
p1.hasOwnProperty('name') // true
console.log('name' in p1) // true
注：ES5 中 Object.getOwnpropertyDescriptor() 方法只能用于实例属性，要取得原型属性的描述符，必须直接在原型对象上调用 Object.getOwnpropertyDescriptor()。
1
2
3
4
5
6
7
Object.getOwnPropertyDescriptor(p1, 'name')
// {
//  configurable: true
//  enumerable: true
//  value: "nobody"
//  writable:true
//}
要取得对象上所有的可枚举的实例属性，可以使用 Object.keys() 方法。
1
2
3
4
5
6
7
8
9
10
function Person () {}
Person.prototype.name = 'JavaScript'
Person.prototype.age = 18
Person.prototype.sayName = function () {}

Object.keys(Person.prototype) // ["name", "age", "sayName"]
let p1 = new Person()
Object.keys(p1) // []
p1.name = 'JavaScript'
Object.keys(p1) // ["name"]
可以看出，Object.keys() 方法只枚举实例属性，并不枚举原型对象中的属性，而且 constructor 属性也是不可枚举的。
更简单的原型语法
1
2
3
4
5
6
7
8
9
function Person () {}
Person.prototype = {
  constructor: Person,
  name: 'JavaScript',
  age: 18,
  sayName: function () {
    console.log(this.name)
  }    
}
这种写法存在一个问题，就是重设的 constructor 属性的 [[Enumerable]] 特性被设置为 true，默认情况下，原生的 constructor 属性是不可枚举的。所以可以写成如下情况：
1
2
3
4
5
6
7
8
9
10
11
12
function Person () {}
Person.prototype = {
  name: 'JavaScript',
  age: 18,
  sayName: function () {
    console.log(this.name)
  }    
}
Object.definedProperty(Person.prototype, 'constructor', {
  enumerable: false,
  value: Person
})
原型的动态性
在修改原型的过程中，我们可以随时为原型添加属性和方法，但是如果重写整个原型对象，那有可能切断构造函数与原型之间的联系。
1
2
3
4
5
6
7
8
9
10
11
function Person () {}
let p1 = new Person()
Person.prototype = {
  constructor: Person,
  name: 'JavaScript',
  age: 18,
  sayName: function () {
    console.log(this.name)
  }        
}
p1.sayName() // p1.sayName is not a function
为什么在调用 p1.sayName() 的时候会发生错误呢，因为 p1 指向的原型对象中并不包含 sayName 方法。
其关系可看下图：
重写原型对象后，切断了现有原型与任何之前已经存在的对象实例之间的联系，它们引用的任然是最初的原型。
原型对象的缺点
原型对象省略了为构造函数传递参数这一环节，使得所有实例在默认情况下都取得相同的属性值，而且原型中所有的属性是被全部实例共享的，这种共享对于函数来说非常合适，但是对于属性值，尤其是引用类型的属性值来说，问题就比较严重了。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
function Person () {}
Person.prototype = {
  constructor: Person,
  name: 'JavaScript',
  age: 18,
  friends: ['Lily', 'Tony'],
  sayName: function () {
    console.log(this.name)
  }        
}

let p1 = new Person()
let p2 = new Person()
p1.friends.push('Jack')
console.log(p2.friends) // ["Lily", "Tony", "Jack"]
p1.friends === p2.friends // true
修改实例 p1 的值的过程中，p2 的值也被修改了。这就导致了仅仅使用原型模式创建对象存在很大的问题。具体解决请查看深入学习JavaScript——面向对象。


深入学习 JavaScript——面向对象
2016-12-01T18:14:29.000Z
JavaScript 面向对象
几乎所有面向对象的语言都有一个标志，那就是类，通过类创建具有相同属性和方法的对象。而 ECMAScript 中没有类的概念，它把对象定义为：“无序属性的集合，其属性可以包含基本值、对象或者函数”。即对象是一组没有特定顺序的值，对象的每个属性或方法都有一个名字，而这个名字都映射到一个值。因此对象的本质是一个散列表。
创建对象
虽然 Object 构造函数或对象字面量都可以创建单个对象，但是这些方式有个明显的缺点：使用同一个接口创建很多对象，会产生大量重复的代码。为了解决这个问题，就可以使用工厂模式来创建对象。
工厂模式
工厂模式用函数来封装特定接口创建对象。
1
2
3
4
5
6
7
8
9
10
11
function createPerson(name, age, job) {
    let o = new Object()
    o.name = name
    o.age = age
    o.job = job
    o.sayName = function () {
        console.log(this.name)
    }
    return o
}
let leo = createPerson('Leo', 18, "Engineer")
工厂模式虽然解决了创建多个相似对象的问题，但没有解决对象识别的问题（即怎样知道一个对象的类型）。
构造函数模式
ECMAScript 中的构造函数可以用来创建特定类型的对象，像 Object 和 Array 的原生的构造函数，在运行时会自动出现在执行环境中。此外，也可以创建自定义的构造函数，从而定义自定义对象类型的属性和方法。代码如下所示：
1
2
3
4
5
6
7
8
9
10
function Person(name, age, job) {
    this.name = name
    this.age = age
    this.job = job
    this.sayName = function() {
        console.log(this.name)
    }
}
let leo = new Person('Leo', 18, "Engineer")
let jack = new Person('Jack', 18, "Engineer")
构造函数模式与工厂模式有以下不同：
没有显式的创建对象；
直接将属性和方法赋给了this对象；
没有return语句；
构造函数应该以大写字母开头，使用 new 操作符。new 操作符创建对象经历以下 4 个步骤：
创建新的对象；
将构造函数的作用域赋给新对象（因此 this 就指向了这个新对象）；
执行构造函数中的代码（为这个新对象添加属性）；
返回新对象；
生成的对象 leo 中有一个 constructor 属性，该属性指向 Person，并且可以用 instanceof 做类型检测。
1
2
3
leo.constructor === Person // true
leo instanceof  Object // true
leo instanceof Person // true
构造函数的缺点在于每个方法都要在每个实例上重新创建一遍。在前面例子中，leo 和 jack 都有一个名为 sayName 的方法，但是这两个方法不属于同一个对象。
那么我们能不能共享一个 sayName() 方法。如果想要完成这种需求，大可像下面代码一样，通过把函数定义转移到构造函数的外部。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
function Person(name, age, job) {
    this.name = name
    this.age = age
    this.job = job
    this.sayName = sayName
}

function sayName() {
    console.log(this.name)
}
let leo = new Person('Leo', 18, "Engineer")
let jack = new Person('Jack', 18, "Engineer")

console.log(leo.sayName === jack.sayName) // true
上面例子中的做法，确实解决了两个函数做同一件事的问题，但是无意中定义了很多全局函数，而这些全局函数中由于包含 “this” 关键字，又只能被某个函数调用。不仅污染了全局作用域，还使得这个自定义的引用类型完全丧失封装性。好在这些问题都可以通过原型模式解决。
原型模式
JavaScript 中创建的每个函数都有一个 prototype 属性，这个属性是一个指针，指向一个对象，而这个对象的用途是包含可以由特定类型的 所有实例共享的属性和方法。prototype是通过调用构造函数而创建的那个对象实例的对象原型，使用原型对象的好处是可以让所有对象实例共享它所包含的属性和方法。
1
2
3
4
5
6
7
8
9
10
function Person() {}
Person.prototype.name = 'Leo'
Person.prototype.age = 18
Person.prototype.sayName = function() {
console.log(this.name)
}
let leo1 = new Person
let leo2 = new Person
leo1.sayName()
leo2.sayName()
在此，我们将 sayName() 方法和所有的属性直接添加到了 Person 的 prototype 属性中，构造函数变成了空函数，而通过 new 创建出来的对象具有相同的属性和方法。但是与构造函数模式不同对的是，新对象的这些属性和方法是由所有的实例共享的，也就是说
1
leo1.sayName === leo2.sayName // true
组合使用构造函数模式和原型模式
创建自定义对象最常见的形式就是组合使用构造函数模式和原型模式，构造函数用于定义类的实例属性，而原型模式用于定义对象的共享属性。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
function Person(name, age) {
    this.name = name
    this.age = age
    this.friends = []
}
Person.prototype = {
    constructor: Person,
    sayName: function() {
        console.log(this.name)
    }
}
let leo = new Person('Leo', 18)
let jack = new Person('Jack', 18)
leo.friends.push('Elsa')
jack.friends.push('Lucy')
leo.sayName === jack.sayName // true
jack.friends === leo.friends // false
实例属性都是在构造函数中定义的，而实例共享属性 constructor 和方法 sayName() 则是在原型中定义的。这种构造函数与原型混成的模式，是目前 ECMAScript 中使用最广泛、认同度最高的一种创建自定义对象的方法。
动态原型模式
动态原型模式将所有信息封装在了构造函数中，而通过构造函数中初始化原型（仅第一个对象实例化时初始化原型），又保持了同时使用构造函数和原型的优点。换句话说，可以通过检查某个应该存在的方法是否有效，来决定是否需要初始化原型。
1
2
3
4
5
6
7
8
9
10
11
function Person(name, age) {
    this.name = name
    this.age = age
    if (typeof this.sayName != 'function') {
        Person.prototype.sayName = function() {
            console.log(this.name)
        }
    }
}
let leo = new Person('Leo', 18)
leo.sayName()
Person 是一个构造函数，通过 new Person() 来生成实例对象。每当一个 Person 的对象生成时，Person 内部的代码都会被调用一次。
如果去掉 if 的话，你每 new 一次(即每当一个实例对象生产时)，都会重新定义一个新的函数，然后挂到 Person.prototype.sayName 属性上。而实际上，你只需要定义一次就够了，因为所有实例都会共享此属性的。而加上 if 后，只在 new 第一个实例时才会定义 sayName 方法，之后就不会了。
假设除了sayName 方法外，你还定义了很多其他方法，比如 sayBye、cry、smile 等等。此时你只需要把它们都放到对 sayName 判断的 if 块里面就可以了。
1
2
3
4
5
if (typeof this.sayName != "function") {
    Person.prototype.sayName = function() {...}
    Person.prototype.sayBye = function() {...}
    Person.prototype.cry = function() {...}
}
这样一来，要么它们全都还没有定义(new 第一个实例时)，要么已经全都定义了(new 其他实例后)，即它们的存在性是一致的，用同一个判断就可以了，而不需要分别对它们进行判断。
使用动图原型模式时，不能使用对象字面量重写原型，如果在已经创建实例的情况下重写原型，会切断现有实例和原型之间的联系。
寄生构造函数模式
寄生构造函数的基本思想是创建一个函数，该函数的作用仅仅是封装创建对象的代码，然后返回新创建的对象。
1
2
3
4
5
6
7
8
9
10
11
function Person(name, age) {
    let o = new Object()
    o.name = name
    o.age = age
    o.sayName = function() {
        console.log(this.name)
    }
    return o
}
let leo = new Person('Leo', 18)
leo.sayName()
在这个例子中，Person 函数创建了一个新对象，并以相应的属性和方法初始化该对象，然后返回这个对象。除了使用 new 操作符并把使用的包装函数叫做构造函数外，这个模式跟工厂模式一模一样。构造函数在不返回值的情况下，默认会返回新的对象实例。
这个模式在特殊的情况下可以用来为对象创建构造函数。假如我们想创建一个具有额外方法的特殊数组，由于不能直接修改 Array 的构造函数，因此可以使用这种模式。
1
2
3
4
5
6
7
8
9
10
function SpecialArray() {
    let values = new Array()
    values.push.apply(values, arguments)
    values.toPipedString = function() {
        return this.join('|')
    }
    return values
}
let colors = new SpecialArray('red', 'blue', 'green')
console.log(colors.toPipedString()) // 'red|blue|green'
关于寄生构造函数模式，有一点需要说明：返回的对象与构造函数或者构造函数的原型属性直接没有关系，所以不能依赖 instanceof 操作符来确定对象类型。
稳妥构造函数模式
稳妥对象，是指没有公共属性，而且方法也不引用 this 的对象，适合在一些安全环境中（禁用 this 和 new），或者在防止数据被其它应用程序改动时使用。稳妥构造函数遵循与寄生构造函数类似的模式，但是有两点不同：一是新创建对象的实例方法不引用 this，二是不使用 new 操作符调用构造函数。
1
2
3
4
5
6
7
8
9
10
function Person(name, age) {
    let o = new Object()
    o.sayName = function() {
        console.log(this.name)
    }
    return o
}

let leo = Person('Leo', 18)
leo.sayName()
注意在这种模式创建的对象中，除了使用 sayName 方法之外，没有其他办法访问 name 属性，即使有其他代码给这个对象添加属性或者方法，也不可能有别的办法访问传入到构造函数中的原始数据。
与寄生构造函数类似，稳妥构造函数模式创建的对象与构造函数直接也没有什么关系，所以不能依赖 instanceof 操作符来确定对象类型。
总结
组合使用构造函数模式和原型模式是目前使用最广的方法，如果不希望构造函数和原型相互分离的话，可以使用动态原型模式。


JavaScript 对象与 Hash 表
2016-12-01T10:02:04.000Z
简介
哈希表(Hash table，也叫散列表)，是根据关键码值(Key value)而直接进行访问的数据结构。也就是说，它通过把关键码值映射到表中一个位置来访问记录，以加快查找的速度。这个映射函数叫做散列函数，存放记录的数组叫做散列表。
JavaScript 中的对象也是以 Key-Value 的形式访问，那么 JavaScript 的对象是否以 Hash 的结构存储呢？
我们首先来看一下 Hash 表结构。
Hash 表结构
数组的特点是：寻址容易，插入和删除困难；而链表的特点是：寻址困难，插入和删除容易，Hash 表综合两者的特性，做出一种寻址容易，插入删除也容易的数据结构。
下图是最常见的 拉链法 做出的 Hash 表
左边是一个数组，数组的每个成员包括一个指针，指向一个链表的头，当然这个链表可能为空，也可能元素很多。我们根据元素的一些特征把元素分配到不同的链表中去，也是根据这些特征，找到正确的链表，再从链表中找出这个元素。
元素特征转变为数组下标的方法就是散列法。上图运用的方法为 整除法，公式为：
index = value % 16
hash表的工作原理：
第一步 先根据给定的key和散列算法得到具体的散列值，也就是对应的数组下标。
第二步，根据数组下标得到此下标里存储的指针，若指针为空，则不存在这样的键值对，否则根据此指针得到此链式数组。
遍历此链式数组，分别取出Key与给定的Key比较，若找到与给定key相等的Key，即在此hash表中存在此要查找的键值对，此后便可以对此键值对进行相关操作；若找不到，即为不存在此键值对。
JavaScript 对象存储形式
JavaScript 对象 Key 存储形式
在我们创建或者访问对象属性的时候，如果使用 对象.属性名 的方式，属性名只能为字符串类型，而且不能以数字开头：
1
2
3
let obj = {};
obj.2 = 2;  //Uncaught SyntaxError: Unexpected number
obj.12s = '12s';  //Uncaught SyntaxError: Invalid or unexpected token
而使用字面量的形式创建对象，或者用 对象[属性名] 的方法，却没有这样的限制:
1
2
3
4
5
6
7
8
9
let o = {};
let obj = {
    x: 1,
    2: 2,
    o: 'object',
    {name: 'Leo'}: 'object'
};
obj['12s'] = '12s';
obj[{name: 'Leo'}] = 'object'; //使用 对象[属性名] 的方式甚至可以把对象当做属性名传入
此时 obj 里面的属性 2 是一个整数吗？
1
2
3
4
5
6
7
8
for (let i in obj) {
    console.log(typeof i, i, obj[i]);
}
// string 2 2
// string x 1
// string o object
// string 12s 12s
// string [object Object] object
由此可见 JavaScript 中对象的 Key 均是 string 类型。
1
2
3
console.log(obj[2] === obj['2']);  // true
object[2]=3;
console.log(object['2']);//3
可见解释器在访问 object[2] 的时候，先将方括号里面的 2 转换成字符串，然后再访问。
而使用 obj[{name: ‘Leo’}] = ‘object’ 的时候，也是同样的，解释器先调用 Objcet.toString 方法把对象 {name: ‘Leo’} 转换成字符串，然后再访问。
1
2
3
4
5
6
7
8
let object = {
  x: 1,
  2: 2
}
Object.prototype.toString = function () {
  return '2';
}
console.log(object[{name: 'Leo'}]);　　// 2
上述的 object[{name: ‘Leo’}] 相当于 object[{name: ‘Leo’}.toString()] 亦相当于 object[‘2’]，于是就得到结果 2。
这里也间接证明了 JavaScript 对象中，所有的 key 都是字符串，即使你访问的时候不是字符串的形式，解释器也会先将其转化为字符串。
可是我们知道整数值直接调用 toString 方法是会报错的，因为 JavaScript 解析器会试图将点操作符解析为浮点数字面值的一部分。不过有很多变通方法可以让数字的字面值看起来像对象。
1
2
3
4
5
2.toString() // Uncaught SyntaxError: Invalid or unexpected token
//解决方案
2..toString(); // 第二个点号可以正常解析
2 .toString(); // 注意点号前面的空格
(2).toString(); // 2先被计算
所以 JavaScript 解释器应该有帮我们做这一部分工作。
JavaScript 对象 Value 存储形式
在JavaScript高级程序设计（第三版）中，是这么描述属性的：属性在创建时都带有一些特征值，JavaScript引擎通过这些特征值来定义他们的行为。
1
2
3
4
5
6
7
8
9
10
var person = {};
person.name = 'Leo';
var descriptor=Object.getOwnPropertyDescriptor(person,"name");
console.log(descriptor); 
//Object
// configurable: true
// enumerable: true
// value: "Leo"
// writable: true
// __proto__: Object
可见 value 的数据类型是结构体。
JavaScript 对象存储形式
在 JavaScript 中，我们可以任意给对象添加或者删除属性，由此可以推断，对象不是由数组结构存储；链表虽然能够任意伸缩但是其查询效率低下，因此也排除链表。如果用树作为存储结构，效率较高的可能就是平衡树了。平衡树的查询效率还可以接受，但是当删除属性的时候，平衡树在调整的时候代价相比于 hash 表要大很多。于是 Hash 成为最好的选择。
假如有这么一段代码：
1
2
3
4
5
6
7
8
9
10
function Person(id, name, age) {
this.id = id;
this.name = name;
this.age = age;
}
let num = 10;
let bol = true;
let obj = new Object;
let arr = ['a', 'b', 'c'];
let person = new Person(100, 'Leo', 18);
JavaScript 内存分析图如下：
变量 num、bol、str 为基本数据类型，它们的值直接存放在栈中。obj、person、arr 为复合数据类型，他们的引用变量存储在栈中，指向于存储在堆中的实际对象。
在 JavaScript 中变量分为基本类型和引用类型（对象类型），分别对应着两种不同的存储方式–栈存储和堆存储。
基本类型一旦初始化则内存大小固定，访问变量就是访问变量的内存上实际的数据，称之为按值访问。而对象类型内存大小不固定，无法在栈中维护，所以 JavaScript 就把对象类型的变量放到堆中，让解释器为其按需分配内存，而通过对象的引用指针对其进行访问，因为对象在堆中的内存地址大小是固定的，因此可以将内存地址保存在栈内存的引用中。这种方式称之为按引用访问。
总结
在 JavaScript 中对象是以 Hash 结构存储的，用  键值对表示对象的属性，Key 的数据类型为字符串，Value 的数据类型是结构体，即对象是以  类型的 HashMap 结构存储的。


Spark RDD 操作详解——Transformations
2016-11-29T15:08:50.000Z
RDD 操作有哪些
Spark RDD 支持2种类型的操作: transformations 和 actions。transformations： 从已经存在的数据集中创建一个新的数据集，如 map。actions： 数据集上进行计算之后返回一个值，如 reduce。
在 Spark 中，所有的 transformations 都是 lazy 的，它们不会马上计算它们的结果，而是仅仅记录转换操作是应用到哪些基础数据集上的，只有当 actions 要返回结果的时候计算才会发生。
默认情况下，每一个转换过的 RDD 会在每次执行 actions 的时候重新计算一次。但是可以使用 persist (或 cache)方法持久化一个 RDD 到内存中，这样Spark 会在集群上保存相关的元素，下次查询的时候会变得更快，也可以持久化 RDD 到磁盘，或在多个节点间复制。
基础
在 Spark-shell 中运行如下脚本
1
2
3
4
scala> val lines = sc.textFile("test.txt")
scala> val lineLengths = lines.map(s => s.length)
scala> val totalLength = lineLengths.reduce((a, b) => a + b))
totalLength: Int = 30
第一步： 定义外部文件 RDD，lines 指向 test.txt 文件， 这个文件即没有加载到内存也没有做其他的操作，所以即使文件不存在也不会报错。
第二步： 定义 lineLengths，它是 map 转换(transformation)的结果。同样，lineLengths 由于 lazy 模式也没有立即计算。
第三步： reduce 是一个 action， 所以真正执行读文件和 map 计算是在这一步发生的。Spark 将计算分成多个 task，并且让它们运行在多台机器上。每台机器都运行自己的 map 部分和本地 reduce 部分，最后将结果返回给驱动程序。
如果我们想要再次使用 lineLengths，我们可以使用 persist 或者 cache 将 lineLengths 保存到内存中。
1
2
3
scala> lineLengths.persist()
scala> lineLengths.collect()
res7: Array[Int] = Array(5, 3, 15, 7)
Transformations
Transformations 是 RDD 的基本转换操作，主要方法有： map， filter， flatMap， mapPartitions， mapPartitionsWithIndex， sample， union， intersection， distinct， groupByKey， reduceByKey， aggregateByKey， sortByKey， join， cogroup， cartesian， pipe， coalesce， repartition。
filter(func)
filter 返回一个新的数据集，从源数据中选出 func 返回 true 的元素。
1
2
3
4
scala> val a = sc.parallelize(1 to 9)
scala> val b = a.filter(x => x > 5)
scala> b.collect
res11: Array[Int] = Array(6, 7, 8, 9)
flatMap(func)
与 map 类似，区别是原 RDD 中的元素经 map 处理后只能生成一个元素，而经 flatmap 处理后可生成多个元素来构建新 RDD， 所以 func 必须返回一个 Seq，而不是单个 item。
举例：对原RDD中的每个元素x产生y个元素（从1到y，y为元素x的值）
1
2
3
4
scala> val a = sc.parallelize(1 to 4, 2)
scala> val b = a.flatMap(x => 1 to x)
scala> b.collect
res12: Array[Int] = Array(1, 1, 2, 1, 2, 3, 1, 2, 3, 4)
mapPartitions(func)
mapPartitions 是 map 的一个变种。map 的输入函数是应用于 RDD 中每个元素，而 mapPartitions 的输入函数是应用于每个分区，也就是把每个分区中的内容作为整体来处理的。
它的函数定义为：
1
def mapPartitions[U](f: (Iterator[T]) => Iterator[U], preservesPartitioning: Boolean = false)(implicit arg0: ClassTag[U]): RDD[U]
f 即为输入函数，它处理每个分区里面的内容。每个分区中的内容将以 Iterator[T] 传递给输入函数 f，f 的输出结果是 Iterator[U]。最终的 RDD 由所有分区经过输入函数处理后的结果合并起来的。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
scala> val rdd = sc.makeRDD(1 to 5, 2)
scala> val rdd2 = rdd.mapPartitions(x => {
     | var result = List[Int]()
     | var i = 0
     | while(x.hasNext) {
     |   i += x.next
     | }
     | result.::(i).iterator
     |})
scala> rdd2.collect
res13: Array[Int] = Array(3, 12)

scala> rdd2.partitions.size
res14: Int = 2
上述例子中 rdd2 将 rdd 每个分区中的数值累加。
mapPartitionsWithIndex(func)
函数定义
1
def mapPartitionsWithIndex[U](f: (Int, Iterator[T]) => Iterator[U], preservesPartitioning: Boolean = false)(implicit arg0: ClassTag[U]): RDD[U]
mapPartitionsWithIndex 的作用与 mapPartitions 相同，不过提供了两个参数，第一个参数为分区的索引。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
scala> val rdd = sc.makeRDD(1 to 5, 2)
scala> val rdd2 = rdd.mapPartitionsWithIndex(
     | (x, iter) => {
     |   var result = List[Int]()
     |   var i = 0
     |    while(iter.hasNext) {
     |     i += iter.next
     |    }
     |   result.::(x + "|" + i).iterator
     |})
scala> rdd2.collect
res14: Array[String] = Array(0|3, 1|12)

scala> rdd2.partitions.size
res15: Int = 2
sample(withReplacement, fraction, seed)
union(otherDataset)
函数定义：
1
def union(other: RDD[T]): RDD[T]
该函数比较简单，就是将两个 RDD 进行合并，不去重。
1
2
3
4
scala> var rdd1 = sc.makeRDD(1 to 2,1)
scala> var rdd2 = sc.makeRDD(2 to 3,1)
scala> rdd1.union(rdd2).collect
res18: Array[Int] = Array(1, 2, 2, 3)
intersection(otherDataset)
函数定义：
1
2
3
def intersection(other: RDD[T]): RDD[T]
def intersection(other: RDD[T], numPartitions: Int): RDD[T]
def intersection(other: RDD[T], partitioner: Partitioner)(implicit ord: Ordering[T] = null): RDD[T]
该函数返回两个 RDD 的交集，并且去重。
参数numPartitions指定返回的RDD的分区数。
参数partitioner用于指定分区函数
1
2
3
4
5
6
7
8
9
10
scala> var rdd1 = sc.makeRDD(1 to 2,1)
scala> rdd1.collect
res19: Array[Int] = Array(1, 2)
 
scala> var rdd2 = sc.makeRDD(2 to 3,1)
scala> rdd2.collect
res20: Array[Int] = Array(2, 3)
 
scala> rdd1.intersection(rdd2).collect
res21: Array[Int] = Array(2)
distinct([numTasks])
返回一个新的 RDD，里面包含源 RDD 中所有的（distinct）元素。
groupByKey([numTasks])
reduceByKey(func, [numTasks])
aggregateByKey(zeroValue)(seqOp, combOp, [numTasks])
sortByKey([ascending], [numTasks])
join(otherDataset, [numTasks])
cogroup(otherDataset, [numTasks])
cartesian(otherDataset)
pipe(command, [envVars])
coalesce(numPartitions)
repartition(numPartitions)


Spark RDD 基础
2016-11-29T11:29:07.000Z
RDD 是什么？
[图片摘自[Spark 官网](http://spark.apache.org/)]RDD 全称 Resilient Distributed Datasets，是 Spark 中的抽象数据结构类型，任何数据在Spark中都被表示为RDD。 Spark 建立在统一抽象的RDD之上，使得它可以以基本一致的方式应对不同的大数据处理场景，包括MapReduce，Streaming，SQL，Machine Learning 等。
简单的理解就是 RDD 就是一个数据结构，不过这个数据结构中的数据是分布式存储的，Spark 中封装了对 RDD 的各种操作，可以让用户显式地将数据存储到磁盘和内存中，并能控制数据的分区。
RDD 特性
RDD 是 Spark 的核心，也是整个 Spark 的架构基础。它的特性可以总结如下：
它是不变的数据结构存储
它是支持跨集群的分布式数据结构
可以根据数据记录的key对结构进行分区
提供了粗粒度的操作，且这些操作都支持分区
它将数据存储在内存中，从而提供了低延迟性
创建 RDD
本文中的例子全部基于 Spark-shell，需要的请自行安装。
创建 RDD 主要有两种方式，一种是使用 SparkContext 的 parallelize 方法创建并行集合，还有一种是通过外部外部数据集的方法创建，比如本地文件系统，HDFS，HBase，Cassandra等。
并行集合
使用 parallelize 方法从普通数组中创建 RDD:
1
2
scala> val a = sc.parallelize(1 to 9, 3)
a: org.apache.spark.rdd.RDD[Int] = ParallelCollectionRDD[0] at parallelize at :21
parallelize 方法接受两个参数，第一个是数据集合，第二个是切片的个数，表示将数据存放在几个分区中。
一旦创建完成，这个分布式数据集(a)就可以被并行操作。例如，我们可以调用 a.reduce((m, n) => m + n) 将这个数组中的元素相加。 更多的操作请见 Spark RDD 操作。
本地文件
文本文件 RDDs 可以使用 SparkContext 的 textFile 方法创建。 在这个方法里传入文件的 URI (机器上的本地路径或 hdfs://，s3n:// 等)，然后它会将文件读取成一个行集合。
读取文件 test.txt 来创建RDD，文件中的每一行就是RDD中的一个元素。
1
2
scala> val b = sc.textFile("test.txt")
b: org.apache.spark.rdd.RDD[String] = MapPartitionsRDD[2] at textFile at :21
一旦创建完成，(b) 就能做数据集操作。例如，我们可以用下面的方式使用 map 和 reduce 操作将所有行的长度相加： b.map(s => s.length).reduce((m, n) => m + n)
1
2
3
4
5
scala> b.collect
res1: Array[String] = Array(Spark, RDD, Transformations, Actions)

scala> b.map(s => s.length).reduce((m, n) => m + n))
res2: Int = 30
Spark 读文件注意事项
如果使用本地文件系统路径，文件必须能在 worker 节点上用相同的路径访问到。要么复制文件到所有的 worker 节点，要么使用网络的方式共享文件系统。
所有 Spark 的基于文件的方法，包括 textFile，能很好地支持文件目录，压缩过的文件和通配符。例如，你可以使用 textFile("/文件目录")，textFile("/文件*.txt") 和 textFile("/文件目录/*.gz")。
textFile 方法也可以选择第二个可选参数来控制切片(slices)的数目。默认情况下，Spark 为每一个文件块(HDFS 默认文件块大小是 64M)创建一个切片(slice)。但是你也可以通过一个更大的值来设置一个更高的切片数目。注意，你不能设置一个小于文件块数目的切片值。
ScalaAPI 对其它数据格式的支持
SparkContext.wholeTextFiles 让你读取一个包含多个小文本文件的文件目录并且返回每一个(filename, content)对。与 textFile 的差异是：它记录的是每个文件中的每一行。
对于 SequenceFiles，可以使用 SparkContext 的 sequenceFile[K, V] 方法创建，K 和 V 分别对应的是 key 和 values 的类型。像 IntWritable 与 Text 一样，它们必须是 Hadoop 的 Writable 接口的子类。另外，对于几种通用的 Writables，Spark 允许你指定原生类型来替代。例如： sequenceFile[Int, String] 将会自动读取 IntWritables 和 Text。
对于其他的 Hadoop InputFormats，你可以使用 SparkContext.hadoopRDD 方法，它可以指定任意的 JobConf，输入格式(InputFormat)，key 类型，values 类型。你可以跟设置 Hadoop job 一样的方法设置输入源。你还可以在新的 MapReduce 接口(org.apache.hadoop.mapreduce)基础上使用 SparkContext.newAPIHadoopRDD(译者注：老的接口是 SparkContext.newHadoopRDD)。
RDD.saveAsObjectFile 和 SparkContext.objectFile 支持保存一个RDD，保存格式是一个简单的 Java
对象序列化格式。这是一种效率不高的专有格式，如 Avro，它提供了简单的方法来保存任何一个 RDD。


深入学习 JavaScript——Object 对象
2016-11-25T15:52:44.000Z
Object–JavaScript世界的起源
JavaScript的世界中「一切皆是对象」，而所有对象的起源就是 Object 对象。
神說：「要有光」。就有了光。
Object简介
JavaScript中的对象其实是一组数据和功能的集合。我们通过执行 new 操作符 + 对象类型的名称来创建对象。
创建 Object 类型的实例并为其添加属性和方法就可以创建自定义对象，Object既是一个对象，也是自身的构造函数。
1
let o = new Object;  //如果不给构造函数传递参数可以省略圆括号，但不推荐这么写
仅仅创建 Object 实例并没有什么用处，但关键是理解一个重要的思想，即在JavaScript中，Object 类型是它所有实例的基础，换句话说，Object类型所具有的任何属性和方法同样存在于更具体的对象中。
Object对象属性
Object 对象一共有三个属性： _proto_, constructor, prototype。
Object._proto_
为对象设置原型
1
2
3
4
5
6
7
function Rectangle() {
}

let rec = new Rectangle();
rec.__proto__ === Rectangle.prototype; // true
rec.__proto__ = Object.prototype;
rec.__proto__ === Rectangle.prototype; //false
_proto_ 属性可用于设置对象的原型
1
2
3
4
5
6
7
8
9
10
11
let proto = { y: 2 };

let obj = { x: 10 };
obj.__proto__ = proto;

proto.y = 20;
proto.z = 40;

obj.x === 10;  // true
obj.y === 20;  // true
obj.z === 40;  // true
这只适用于可扩展的对象，一个不可扩展的对象的 _proto_ 属性是不可变的
1
2
3
4
let obj = {};
Object.preventExtensions(obj);

obj.__proto__ = {}; // 抛出异常TypeError
Object.constructor
所有对象都会从它的原型上继承一个 constructor 属性， constructor 属性是保存当前对象的构造函数。
1
2
3
4
5
6
let o = new Object; // 或者 o = {}
o.constructor === Object; // true
let a = new Array  // 或者 a = []
a.constructor === Array; // true
let n = new Number(3); // 或者 n = 3
n.constructor === Number; // true
Object.prototype
Object.prototype 属性表示对象 Object 的原型对象，由于所有的对象都是基于 Object，所以 所有的对象都继承了Object.prototype的属性和方法，除非这些属性和方法被其他原型链更里层的改动所覆盖。
Object.prototype.hasOwnProperty()
返回一个布尔值 ，表示某个对象是否含有指定的属性，而且此属性非原型链继承的。
1
2
3
4
5
let o = new Object();
o.name = 'object';
o.hasOwnProperty('name');             // true
o.hasOwnProperty('toString');         // false
o.hasOwnProperty('hasOwnProperty');   // false
Object.prototype.isPrototypeOf()
返回一个布尔值，表示指定的对象是否在本对象的原型链中。
1
2
3
4
5
function Rectangle() {
}
let rec = new Rectangle();

Rectangle.prototype.isPrototypeOf(rec); // true
Object.prototype.propertyIsEnumerable()
判断指定属性是否可枚举。
1
object.propertyIsEnumerable(proName)
如果 proName 存在于 object 中，且可以使用 for 循环对其进行枚举，则 propertyIsEnumerable 方法返回 true。如果 object 不具有所指定名称的属性或者所指定的属性是不可枚举的，则 propertyIsEnumerable 方法将返回 false。
1
2
3
let a = new Array("apple", "banana", "cactus");
a.propertyIsEnumerable(1); // true，0-2 都是true
a.propertyIsEnumerable(3); // false
Object.prototype.toString()
返回对象的字符串表示。
1
2
let o = {};
o.toString() // "[object Object]"
上面代码调用空对象的 toString 方法，结果返回一个字符串 “[object Object]”，其中第二个Object表示该值的构造函数，
实例对象可能会自定义 toString 方法，覆盖掉 Object.prototype.toString 方法。通过函数的 call 方法，可以在任意值上调用 Object.prototype.toString 方法，帮助我们判断这个值的类型。
1
2
3
4
5
6
7
8
9
10
Object.prototype.toString.call(0) // "[object Number]"
Object.prototype.toString.call('') // "[object String]"
Object.prototype.toString.call(true) // "[object Boolean]"
Object.prototype.toString.call(undefined) // "[object Undefined]"
Object.prototype.toString.call(null) // "[object Null]"
Object.prototype.toString.call(Math) // "[object Math]"
Object.prototype.toString.call({}) // "[object Object]"
Object.prototype.toString.call([]) // "[object Array]"
Object.prototype.toString.call(Symbol()) //"[object Symbol]"
Object.prototype.toString.call(/./) //"[object RegExp]"
Object.prototype.valueOf()
返回指定对象的原始值。valueOf() 方法的作用是返回一个对象的“值”，默认情况下返回对象本身。
valueOf方法的主要用途是，JavaScript自动类型转换时会默认调用这个方法。
1
2
3
4
5
6
7
8
9
10
let o = new Object();
1 + o // "1[object Object]"  //默认调用valueOf()方法

//自定义valueOf() 方法

Object.prototype.valueOf = function() {
return 2;
}

1 + new Object; // 3
Object对象方法
函数 描述
Object.assign(target, …sources) 将来自一个或多个源对象中的值复制到一个目标对象。
Object.create(prototype, descriptors) 创建具有指定原型并可选择包含指定属性的对象。
Object.defineProperties(obj, props) 将一个或多个属性添加到对象，和/或修改现有属性的特性。
Object.defineProperty(obj, prop, descriptor) 将属性添加到对象，或修改现有属性的特性。
Object.freeze(obj) 防止修改现有属性的特性和值，并防止添加新属性。
Object.getOwnPropertyDescriptor(obj, prop) 返回数据属性或访问器属性的定义。
Object.getOwnPropertyNames(obj) 返回对象属性及方法的名称。
Object.getOwnPropertySymbols(obj) 返回对象的符号属性。
Object.getPrototypeOf(obj) 返回对象的原型。
Object.is(value1, value2) 返回一个值，该值指示两个值是否相同。
Object.isExtensible(obj) 返回指示是否可将新属性添加到对象的值。
Object.isFrozen(obj) 如果无法在对象中修改现有属性的特性和值，并且无法将新属性添加到对象，则返回 true。
Object.seal(obj) 防止修改现有属性的特性，并防止添加新属性。
Object.isSealed(obj) 如果无法在对象中修改现有属性特性，并且无法将新属性添加到对象，则返回 true。
Object.keys(obj) 返回对象的 可枚举属性和方法的名称。
Object.preventExtensions(obj) 防止向对象添加新属性。
Object.setPrototypeOf(obj, prototype) 设置对象的原型。
Object.assign(target, …sources)
Object.assign() 方法可以把任意多个的源对象自身的可枚举属性拷贝给目标对象，然后返回目标对象。
如果存在分配错误，此函数将引发 TypeError，这将终止复制操作。如果目标属性不可写，则将引发 TypeError。
1
2
3
4
5
6
7
let first = { name: "Leo" };
let last = { lastName: "Li" };

let person = Object.assign(first, last);
console.log(person); //{ name: "Leo", lastName: "Li" } 

let clone = Object.assign({}, person); //使用 Object.assign 克隆对象。
Object.create(prototype, descriptors)
创建一个具有指定原型且包含指定属性的对象。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
let newObj = Object.create(null, {
  size: {
    value: "large",
    enumerable: true
  },
  shape: {
    value: "round",
    enumerable: true
  }
});

console.log(newObj.size); // large
console.log(newObj.shape); // round
console.log(Object.getPrototypeOf(newObj)); //null
使用Object.create实现类式继承
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
function Shape() {
  this.x = 0;
  this.y = 0;
}

Shape.prototype.move = function(x, y) {
    this.x += x;
    this.y += y;
    console.info("Shape moved.");
};

// Rectangle - subclass
function Rectangle() {
  Shape.call(this); //call super constructor.
}

Rectangle.prototype = Object.create(Shape.prototype);

let rect = new Rectangle();

rect instanceof Rectangle //true.
rect instanceof Shape //true.

rect.move(1, 1); //Outputs, "Shape moved."
Object.keys(obj)
返回对象可枚举的属性名组成的数组。
1
2
3
4
5
6
7
let a = ["Hello", "World"];

Object.keys(a)
// ["0", "1"]

Object.getOwnPropertyNames(a)
// ["0", "1", "length"]
Object.getOwnPropertyNames(obj)
返回一个由指定对象的所有自身属性的属性名（包括不可枚举属性）组成的数组。
1
2
let arr = ["a", "b", "c"];
Object.getOwnPropertyNames(arr).sort(); //[ '0', '1', '2', 'length' ]
Object.getOwnPropertySymbols(obj)
该特性属于 ECMAScript 2015（ES6）规范。
Object.getOwnPropertySymbols() 方法会返回一个数组，该数组包含了指定对象自身的（非继承的）所有 symbol 属性键。
1
2
3
4
5
6
7
8
9
10
11
12
let obj = {};
let a = Symbol("a");
let b = Symbol.for("b");

obj[a] = "a";
obj[b] = "b";

let objectSymbols = Object.getOwnPropertySymbols(obj);

objectSymbols.length; // 2
objectSymbols;        // [Symbol(a), Symbol(b)]
objectSymbols[0];     // Symbol(a)
对象限制型方法
ES5中提供了一系列限制对象被修改的方法，用来防止被某些对象被无意间修改导致的错误。每种限制类型包含一个判断方法和一个设置方法。
阻止对象扩展
Object.preventExtensions() 用来限制对象的扩展，设置之后，对象将无法添加新属性。
对象的属性不可用扩展，但是已存在的属性可以被删除。
无法添加新属性指的是无法在自身上添加属性，如果是在对象的原型上，还是可以添加属性的。
Object.isExtensible() 方法用来判断一个对象是否可扩展。
将对象密封
Object.seal() 可以密封一个对象并返回被密封的对象。
密封对象无法添加或删除已有属性，也无法修改属性的enumerable，writable，configurable，但是可以修改属性值。
通过 Object.isSealed() 判断一个对象是否密封。
冻结对象
Object.freeze() 方法用来冻结一个对象，被冻结的对象将无法添加，修改，删除属性值，也无法修改属性的特性值，即这个对象无法被修改。被冻结的对象无法删除自身的属性，但是通过其原型对象还是可以新增属性的。
通过 Object.isFrozen() 可以用来判断一个对象是否被冻结了。
其它
Object.defineProperties、Object.defineProperty、Object.freeze、Object.getOwnPropertyDescriptor 的用法请参考使用Object.defineProperty为对象定义属性。
总结
Object 对象虽然平时我们很少直接用到，但是很多对象的属性和方法都是由 Object 继承而来的，因此非常具有学习意义。
这篇 Blog 虽然都是 API 级别的学习，可是很多东西都是欠下的技术债，就当补课了。


深入学习 JavaScript——闭包
2016-11-24T22:39:45.000Z
什么是闭包（Closure）
“函数挂载父环境的时机，如果是定义时就是闭包，如果是执行时就不是闭包。”——听一位大神同事讲的。
“闭包是指那些能够访问独立(自由)变量的函数 (变量在本地使用，但定义在一个封闭的作用域中)。换句话说，这些函数可以“记忆”它被创建时候的环境。”——MDN
刚学JavaScript的时候看了这些定义后我就哭了，要想理解闭包还是要看例子。
举个栗子
1
2
3
4
5
6
7
8
9
10
11
12
function foo() {
    let a = 1;
    function inner () {
        console.log(a++);
    };
    return inner;
}

let fun = foo();
fun(); //1
fun(); //2
fun = null; //a被垃圾回收
函数 foo 返回一个内部函数 inner，所以“let fun = foo()”的结果应该是“fun = inner” 也就是 “fun = function (){console.log(a++)};”
那么当执行 fun() 的时候 a=?，显然在 fun 的外部环境中是没有 a 的定义的，于是就向 inner 函数定义时候的父环境中找 a，果然在 foo 函数中找到了。这样就可以理解上面给出的第一个闭包的定义了：一个函数在执行的时候，如果能拿到定义时候父环境的值，这样就是闭包，反之则不是闭包。
那闭包究竟是一个什么东西呢？我们可以把闭包理解成 “函数 + 函数创建时的环境”的组合，比如上面的 inner 函数 + 变量a 就是一个闭包。
闭包的用途
通过使用闭包，我们可以做很多事情。
JavaScript面向对象
提升代码效率
编写更优雅的代码
匿名自执行函数（立即执行函数表达式）
匿名自执行函数有两个作用：
不污染全局变量
函数执行完立刻释放垃圾回收
比如我上面栗子中创建的函数 foo 会自动绑定到全局变量中
1
window.foo()(); //1
这样我们每次创建一个函数都必须要使用 const/let/var 去声明一个变量等于函数，不然全局对象的属性会越来越多，从而影响访问速度(因为变量的取值是需要从原型链上遍历的)，而且可能会导致变量冲突。
结果缓存
结果缓存是闭包能显著提高程序效率的一个用途。假如有一个处理过程很耗时的函数对象，我们可以将每次处理的结果缓存起来，当再次调用这个函数的时候，就先从缓存中查找。
1
2
3
4
5
6
7
8
9
10
11
12
13
const cacheSearch = (function() {
    var cache = {};

    function search(key) {
        if (key in cache) {
            return cache[key];
        } else {
            cache[key] = `Hello ${key}`; //假如这是一步比较复杂的计算
            return cache[key];
        }
    }
    return search;
})();
封装
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
const foo = (function() {
    let name = 'name'; // “闭包”内的函数可以访问 name 变量，而 name 变量对于外部却是隐藏的
    return {
        getName: function() { // 通过定义的接口来访问 name
            return name;
        },
        setName: function(new_name) { // 通过定义的接口来修改 name
            name = new_name;
        }
    };
}());

foo.getName(); // 得到 'name'
foo.setName('newName'); // 通过函数接口，我们访问并修改了 name 变量
foo.getName(); // 得到 'newName'
foo.name; // Type error，访问不能
实现类和继承
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
function Person() {
  let name = 'God';

  return {
    getName: function() {
      return name;
    },
    setName: function(newName) {
      name = newName;
    }
  }
};

let Student = function() {};
//继承自Person
Student.prototype = new Person();
//添加私有方法
Student.prototype.Say = function(name) {
  console.log(`Hello ${name}`);
};
let leo = new Student();
leo.setName('Leo');
leo.Say('World');
console.log(leo.getName());
这里的 Person 是一个函数，由于 JavaScript “没有” class 的概念（有 class 关键字）
，所以在 JavaScript 中，new 后面跟的是构造函数。
上面的代码里面定义了 Student 继承自 Person，所以拥有 getName 方法，然后通过prototype添加自己的方法。
经典题目
实现每隔一秒输出一个递增的数字（0 到 5）
1
2
3
4
5
for (var i = 0; i < 5; i++) {
    setTimeout(() => {
        console.log(i)
    }, i * 1000)
}
上面这种写法想必大家都知道结果是什么，那就是每隔一秒输出一个5
使用闭包实现输出数字为 0 到 5
1
2
3
4
5
6
7
for (var i = 0; i < 5; i++) {
    ((a) => {
        setTimeout(() => {
            console.log(a)
        }, a * 1000)
    })(i)
}
还有一种使用闭包的方式是使用 Array 的 forEach 循环，forEach 里的执行函数也行成了一个闭包
1
2
3
4
5
[0, 1, 2, 3, 4].forEach((i) => {
    setTimeout(() => {
        console.log(i)
    }, i * 1000)
})
当然使用 ES6 的 let 才是最好的选择
1
2
3
4
5
for (var i = 0; i < 5; i++) {
    setTimeout(() => {
        console.log(i)
    }, i * 1000)
}
闭包总结
闭包三个特性：
函数嵌套函数
函数内部可以引用外部的参数和变量
参数和变量不会被垃圾回收机制回收
闭包的优点：
希望一个变量长期驻扎在内存中
避免全局变量的污染
私有成员的存在
闭包的缺点：
闭包的缺点就是常驻内存，会增大内存使用量，使用不当很容易造成内存泄露。


在 Hexo 中插入音乐与视频
2016-11-22T21:28:11.000Z
网易云音乐iframe
首先打开网易云音乐首页找到你想要的音药，点击 「生成外链播放器」
选择合适的尺寸后将生成的 iframe 插件或者 flash 插件代码复制到 markdown 中即可。
腾讯视频
优酷视频
优酷暂时没有 https，这个比较讨厌。
B站
B 站的视频，找到想要分享的视频，点击下方的分享即可。



使用 Object.defineProperty 为对象定义属性
2016-11-21T22:38:27.000Z
先说句题外话
目前前端开发中比较流行的两个框架： Angular 和 Vue 都采用了数据双向绑定的技术。
Angular1 中数据双向绑定是通过「脏检测」的方式实现，每当数据发生变更，对所有的数据和视图的绑定关系进行一次检测，识别是否有数据发生了变化以及这个变化是否会影响其它数据的变化，然后将变更的数据发送到视图，更新页面展示。
Vue 数据双向绑定的原理与Angular有所不同，网上人称「数据劫持」。Vue使用的是 ES5 提供的 Object.defineProperty() 结合发布者-订阅者模式，通过Object.defineProperty() 来劫持各个属性的setter，getter，在数据变动时发布消息给订阅者，触发相应的监听回调。
Object.defineProperty()
定义以及使用
Object.defineProperty() 方法会直接在一个对象上定义一个新属性，或者修改一个已经存在的属性， 并返回这个对象。
我们来看下一般使用方法：
1
2
3
4
5
let Leo = Object.defineProperty({}, 'name', {
    value: 'Leo'
});

console.log(Leo.name); //Leo
其基本语法规则如下：
1
Object.defineProperty(obj, prop, descriptor)
obj: 需要定义属性的对象。
prop: 需定义或修改的属性的名字。
descriptor: 将被定义或修改的属性的描述符。
返回值: 返回传入函数的对象，即第一个参数obj
所以 Object.defineProperty(obj, ‘name’, { value: ‘Leo’}) 相当于 obj.name = ‘Leo’ 或者 **obj[‘name’] = ‘Leo’**喽。
那我们直接使用「对象.属性」就好了，为什么要用 Object.defineProperty 这么复杂的方法呢？
Object.defineProperty 解决什么问题
如果你想定义一个对象的属性为只读怎么办？
「对象.属性」能做到吗？显然不能！Object.defineProperty 却可以做到。因此 Object.defineProperty 方法是对属性更加精确的定义。
属性的状态设置
我们可以在descriptor参数中设置如下值，来实现对属性的控制：
value：默认为 undefined。该属性的值。
writable：默认为 false。该属性是否可写，如果设置成 false，则任何对该属性改写的操作都无效（严格模式会报错，正常模式则什么都不做）
configurable：默认为 false。当且仅当该属性的 configurable 为 true 时，该属性描述符才能够被改变，也能够被删除。
enumerable：默认为 false。当且仅当该属性的 enumerable 为 true 时，该属性才能够出现在对象的枚举属性中（for…in 或者 Object.keys）
get: 默认为 undefined。一个给属性提供 getter 的方法。该方法返回值被用作属性值。
set: 默认为 undefined。一个给属性提供 setter 的方法。该方法将接受唯一参数，并将该参数的新值分配给该属性。
value、writable
1
2
3
4
5
6
7
let Leo = Object.defineProperty({}, 'name', {
    writable: true, //writable 为true的时候name属性才可以被更改
    value: 'Leo'
});

Leo.name = 'Jack'; //strict mode下修改writable为false的属性会报错
console.log(Leo.name);
configurable
1
2
3
4
5
6
let Leo = Object.defineProperty({}, 'name', {
    configurable: true,
    value: 'Leo'
});

delete Leo.name; //configurable为false的时候删除属性会报错
configurable 参数不仅负责属性的删除，也与属性修改有关。
1
2
3
4
5
6
7
8
9
10
11
let Leo = Object.defineProperty({}, 'name', {
    configurable: false,
    value: 'Leo'
});

Object.defineProperty(Leo, 'name', {
    configurable: true, // Cannot redefine property: name
    value: 'Jack', //Cannot redefine property: name
    writable: true, //Cannot redefine property: name
    enumerable: true //Cannot redefine property: name
});
假如一个属性被定义成 configurable 为 false，则这个属性既不能修改值（value），又不能修改属性的属性（configurable，writable，enumerable）；如果 configurable 为 true 就可以放心修改了。
1
2
3
4
5
6
7
8
9
10
11
let Leo = Object.defineProperty({}, 'name', {
    configurable: true,
    value: 'Leo'
});

Object.defineProperty(Leo, 'name', {
    configurable: true,
    value: 'Jack',
    writable: true,
    enumerable: true
});
enumerable
属性特性 enumerable 定义了对象的属性是否可以在 for…in 循环和 Object.keys() 中被枚举。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
let o = Object.defineProperty({}, "a", {value: 1, enumerable: true});
Object.defineProperty(o, "b", {value: 2, enumerable: false});
Object.defineProperty(o, "c", {value: 3}); // enumerable defaults to false
o.d = 4; // 如果使用直接赋值的方式创建对象的属性，则这个属性的enumerable为true

for (let i in o) {    
  console.log(i); // "a" "d" 
}

Object.keys(o); // ["a", "d"]

o.propertyIsEnumerable('a'); // true
o.propertyIsEnumerable('b'); // false
o.propertyIsEnumerable('c'); // false
get、set
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
let name = 'Leo';
let Leo = Object.defineProperty({}, 'name', {
    get: function() {
        console.log('get');
        return name;
    },
    set: function(newName) {
        console.log('set');
        name = newName;
    },
    enumerable: true,
    configurable: true
});

Leo.name = 'Jack'; // 'set'
console.log(Leo.name); // 'get' 'Jack'
在对Leo.name进行赋值的时候，其实是调用了name的set方法；而使用Leo.name的时候则调用了get方法。这就是Vue数据双向绑定的原理：每当数据发生改变，其实是调用了set方法，set方法里面发布数据变动的消息给订阅者，触发相应的监听回调。
注意： 如果 get 方法与 value 同时出现，会报错。
1
2
3
4
5
6
7
let name = 'Leo';
let Leo = Object.defineProperty({}, 'name', {
    value: name, // A property cannot both have accessors and be writable or have a value
    get: function() {
        return name;
    }
});
相关的方法
Object.getOwnPropertyDescriptor(obj, prop)
Object.getOwnPropertyDescriptor() 返回指定对象上一个自有属性对应的属性描述符。
1
2
3
4
5
6
7
8
9
let Leo = Object.defineProperty({}, 'name', {
    value: 'Leo'
});

console.log(Object.getOwnPropertyDescriptor(Leo, 'name')); 
//{ value: 'Leo',
//  writable: false,
//  enumerable: false,
//  configurable: false }
Object.defineProperties(object, descriptors)
Object.defineProperties 与 Object.defineProperty 作用相同，不过可以同时将多个属性添加/修改到对象。
Object.freeze(obj)
Object.freeze() 方法可以冻结一个对象，冻结指的是不能向这个对象添加新的属性，不能修改其已有属性的值，不能删除已有属性，以及不能修改该对象已有属性的可枚举性、可配置性、可写性。也就是说，这个对象永远是不可变的。该方法返回被冻结的对象。
最后
了解了 Object.defineProperty 的用法，接下来就是写一个自己的 Vue.js 了。敬请期待。


使用 Travis CI 自动部署 Hexo
2016-11-18T10:00:36.000Z
Travis CI
Travis CI 是一个持续集成的平台，我们可以使用其自动构建部署的功能帮我们简化 Hexo 博客的部署流程。
为什么要用 Travis CI
因为懒。 
Hexo 部署 Blog 到 GitPage 通常需要三部曲：
1
2
3
$ hexo clean
$ hexo g
$ hexo deploy
很简单吧，但是如果是一个新的环境，你需要安装一大堆工具和依赖，比如要装 Node，要装 Hexo，还有 package.json 里面的各种依赖，虽然 Npm 提供了强大的包管理功能，但是有时候就是不方便。
使用 Travis，你只需要本地有一个 git 就可以了。
每当你 Push 一个 commit 到 Github 时，Travis CI 会检测到你的提交，并根据配置文件自动运行一些命令，通常这些命令用于测试，构建等等。
那么在我们的需求下，就可以用它运行一些 hexo deploy -g 之类的命令用来自动生成、部署我们的网站。
使用方法
使用 Travis 构建 Hexo 只需要三步：
登录 Travis，配置仓库
在 Travis CI 配置 GitHub 的 Access Token
Blog 根目录下配置 .travis.yml
配置 Travis 仓库
首先使用 GitHub 账号登录Travis CI，登录后会进入如下页面
点击「My Repositories」后面的 +，添加要自动构建的仓库
这里会显示你 GitHub 下所有的项目，选中博客仓库，我的博客在GitHub上的仓库名字就叫做 Blog。然后点击仓库名进入仓库配置页面。
选择 Settings，配置选择如下：
Build only if .travis.yml is present：是只有在 .travis.yml 文件中配置的分支改变了才构建
Build pushes：当推送完这个分支后开始构建
这个时候，我们已经开启要构建的仓库，但是如何将构建完成后的文件推送到 Github 上呢？
GitHub Access Token
Github 支持一种特殊的 URL 来执行 push/pull 等等操作，而不需要输入用户名密码。但这需要事先在 Github 上创建一个 token。
首先去 GitHub Settings 页面选择 Personal access tokens，如果你已经登录了，点击链接进去即可。
选择 Generate new token，配置如下：
点击绿色确认按钮，copy 刚刚生成的 token。回到 Travis Settings 页面，将复制的 token 加入到环境变量，并命名为  GitHub_token。
.travis.yml
上述步骤完成后，只需要在你 Blog 源代码的根目录下增加一个 .travis.yml 文件，
我的文件内容如下：
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
language: node_js
node_js: stable

install:
  - npm install

script:
  - hexo clean
  - hexo g

after_script:
  - cd ./public
  - git init
  - git config user.name "YOUR GITHUB USER NAME"
  - git config user.email "YOUR GITHUB EMAIL"
  - git add .
  - git commit -m "Update"
  - git push --force --quiet "https://${GitHub_token}@${GH_REF}" master:master

branches:
  only:
    - master
env:
 global:
   - GH_REF: github.com/Leo555/Leo555.github.io.git
将上面的 name 和 email 还有 GH_REF 修改成你自己的。
这里用 Linux 环境变量的引用方式将 GH_REF 和 GitHub_token 其引入 git push 的 url，因此 push 方法就能通过 GitHub OAuth 授权，完成自动 push 的功能。
此时就万事俱备了。
测试
使用 Hexo 创建新的 Blog 文件，然后 push 到 GitHub 上。
1
2
3
4
$ hexo new test.md
$ git add .
$ git commit -m "add new post test"
$ git push origin master
然后回到 Travis 主页面，发现部署已经开始了
在下面的 log 中可以看到部署的详细情况。
包括 nvm install，npm install，hexo g 等命令都在这里执行。
总结
有了自动部署的功能，从此以后就可以将关注点集中在博客内容上，换了平台和环境也没有任何影响。


Node.js 中 child_procss 模块
2016-11-16T20:53:46.000Z
简介
Node.js 的单线程模型给了它无数的赞美，也带给它无数的诟病。单线程模型，让开发者远离了线程调度的复杂性，使用事件驱动也能开发出一个高并发的服务器；同样也是因为单线程，让CPU密集型计算应用完全不适用。
Node.js 中内建了一个 child_process模块，可以在程序中创建子进程，从而实现多核并行计算。
child_process
child_process 是 Node.js 中一个非常重要的模块，主要功能有：
创建子进程
主进程与子进程通信
主进程读取子进程返回结果
使用 child_process 模块创建进程一共有六种方法（Node.js v7.1.0）
异步创建进程
child_process.exec(command[, options][, callback])
child_process.execFile(file[, args][, options][, callback])
child_process.fork(modulePath[, args][, options])
child_process.spawn(command[, args][, options])
同步创建进程
child_process.execFileSync(file[, args][, options])
child_process.execSync(command[, options])
child_process.spawnSync(command[, args][, options])
以异步函数中 spawn 是最基本的创建子进程的函数，其他三个异步函数都是对 spawn 不同程度的封装。spawn 只能运行指定的程序，参数需要在列表中给出，而 exec 可以直接运行复杂的命令。
spawn()
spawn从定义来看，有3个参数。
1
child_process.spawn(command[, args][, options])
command: 执行的命令
args: 参数列表，可输入多的参数
options: 环境变量对象
return: 返回一个ChildProcess 类的实例
options
cwd [String] Current working directory of the child process
env [Object] Environment key-value pairs
argv0 [String] Explicitly set the value of argv[0] sent to the child process. This will be set to command if not specified.
stdio [Array] | [String] Child’s stdio configuration. (See options.stdio)
detached [Boolean] Prepare child to run independently of its parent process. Specific behavior depends on the platform, see options.detached)
uid [Number] Sets the user identity of the process. (See setuid(2).)
gid [Number] Sets the group identity of the process. (See setgid(2).)
shell [Boolean] | [String] If true, runs command inside of a shell. Uses ‘/bin/sh’ on UNIX, and ‘cmd.exe’ on Windows. A different shell can be specified as a string. The shell should understand the -c switch on UNIX, or /d /s /c on Windows. Defaults to false (no shell).
spawn 方法创建一个子进程来执行特定命令，它没有回调函数，只能通过监听事件，来获取运行结果。属于异步执行，适用于子进程长时间运行的情况。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
let child_process = require('child_process');

let path = '.';
let child = child_process.spawn('ls', ['-l', path]);
child.stdout.on('data', (data) => {
    console.log('stdout: ' + data);
});

child.stderr.on('data', (data) => {
    console.log('stderr: ' + data);
});

child.on('close', (code) => {
    console.log('child process exited with code ' + code);
});
spawn 方法通过 stream 的方式发数据传给主进程，从而实现了多进程之间的数据交换。
exec()
exec 方法的定义如下：
1
child_process.exec(command[, options][, callback])
exec 方法是对 spawn 方法的封装，增加了 shell/bash 命令解析和回调函数，更加符合 JavaScript 的函数调用习惯。
command参数是一个命令字符串
1
2
3
4
5
6
7
8
9
let exec = require('child_process').exec;

let ls = exec('ls -l', function (error, stdout, stderr) {
  if (error) {
    console.error(error.stack);
    console.log('Error code: ' + error.code);
  }
  console.log('Child Process STDOUT: ' + stdout);
});
exec 方法第二个参数是回调函数，该函数接受三个参数，分别是发生的错误、标准输出的显示结果、标准错误的显示结果。
由于标准输出和标准错误都是流对象（stream），可以监听 data 事件，因此上面的代码也可以写成下面这样。
1
2
3
4
5
6
7
8
9
10
11
12
let exec = require('child_process').exec;
let child = exec('ls -l');

child.stdout.on('data', (data) => {
    console.log('stdout: ' + data);
});
child.stderr.on('data', (data) => {
    console.log('stdout: ' + data);
});
child.on('close', (code) => {
    console.log('closing code: ' + code);
});
exec 方法会直接调用 bash（/bin/sh程序） 来解释命令，如果用户输入恶意代码，将会带来安全风险。因此，在有用户输入的情况下，最好不使用 exec 方法，而是使用 execFile 方法。
execFile()
execFile的定义如下：
1
child_process.execFile(file[, args][, options][, callback])
execFile 命令有四个参数，file 和callbakc 为必传参数，options、args 为可选参数：
file 要执行程序的文件或命令名。字符串类型
args 要执行程序或命令的参数列表。数组类型
options 可选参数对象，与exec的options对象相同
callback 子进程执行完毕的回调函数。与exec的callback函数相同
返回值: ChildProcess 对象
execFile 从可执行程序启动子进程。与 exec 相比，execFile 不启动独立的 bash/shell，因此更加轻量级，也更加安全。 execFile 也可以用于执行命令。
1
2
3
4
5
6
7
8
let childProcess = require('child_process');
let path = ".";
childProcess.execFile('ls', ['-l', path], (err, result) => {
    if (err) {
        console.error(err);
    }
    console.log(result)
});
那么，什么时候使用 exec，什么时候使用 execFile 呢？
如果命令参数是由用户来输入的，对于 exec 函数来说是有安全性风险的，因为 Shell 会运行多行命令，比如 ’ls -l .;pwd，如逗号分隔，之后的命令也会被系统运行。但使用 exeFile 命令时，命令和参数分来，防止了参数注入的安全风险。
fork()
fork 函数，用于在子进程中运行的模块，如 fork(’./son.js’) 相当于 spawn(‘node’, [’./son.js’]) 。与 spawn 方法不同的是，fork 会在父进程与子进程之间，建立一个通信管道，用于进程之间的通信。
假设有一个主进程文件 mian.js:
1
2
3
4
5
6
7
8
9
let childProcess = require('child_process');
let son = childProcess.fork('./son.js');

son.on('message', (m) => {
    console.log('Main Listen: ', m);
});
son.send({
    hello: 'son'
});
有一个子进程文件 son.js:
1
2
3
4
5
6
process.on('message', (m) => {
    console.log('Son Listen:', m);
});
process.send({
    Hello: 'main'
});
运行程序：
1
2
3
$ node test.js
Son Listen: { hello: 'son' }
Main Listen:  { Hello: 'main' }
通过 main.js 启动子进程 son.js，通过 process 在两个进程之间传递数据。
使用 child_process.fork() 生成新进程之后，就可以用 son.send(message, [sendHandle]) 向新进程发送消息，新进程中通过监听message事件，来获取消息，这就是主线程与子线程之间的通信方式。
Windows
在Windows上执行一个 .bat 或者 .cmd 文件的方式略有不同。
假如有一个bat文件 my.bat
spawn
1
2
3
4
5
6
7
8
9
10
11
12
13
14
const spawn = require('child_process').spawn;
const bat = spawn('cmd.exe', ['/c', 'my.bat']);

bat.stdout.on('data', (data) => {
  console.log(data);
});

bat.stderr.on('data', (data) => {
  console.log(data);
});

bat.on('exit', (code) => {
  console.log(`Child exited with code ${code}`);
});
exec
1
2
3
4
5
6
7
8
const exec = require('child_process').exec;
exec('my.bat', (err, stdout, stderr) => {
  if (err) {
    console.error(err);
    return;
  }
  console.log(stdout);
});
如果文件名中有空格：
1
2
3
4
5
const bat = spawn('"my script.cmd"', ['a', 'b'], { shell:true });
// or:
exec('"my script.cmd" a b', (err, stdout, stderr) => {
  // ...
});



快速排序思想解决水桶问题
2016-11-16T09:41:44.000Z
水桶问题
假设给你n个红色的水壶和n个蓝色的水壶。它们的形状和尺寸都各不相同。所有的红色水壶盛水量都各不相同，蓝色水壶也是如此。但对于每一个红色水壶来说，都有一个蓝色水壶盛水量和其相同；反之亦然。
你的任务是配对出全部盛水量相同的红色水壶和蓝色水壶。为此，可以执行的操作为，挑出一对水壶，一只红色一只蓝色，将红色水壶灌满水，将红色水壶的水倒入蓝色水壶中，看其是否恰好灌满来判断，这个红色水壶的盛水量大于、小于或等于蓝色水壶。假设这样的比较需要花费一个单位时间。
请找出一种算法，它能够用最少的比较次数来确定所有水壶的配对。
注意:不可直接比较两个红色或者两个蓝色水壶，一次比较必须取一只红色一只蓝色。
解决方案
快速排序思想解
1.首先在集合中选取一个元素作为 「基准」 pivot
2.将集合中所有元素与「基准」元素进行对比，所有小于「基准」的元素，都移到「基准」的左边；所有大于「基准」的元素，都移到「基准」的右边。
3.对「基准」元素左右两边的集合，分别进行上述两步，直到所有的子集只剩下一个元素。
代码描述：
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
const quickSort = arr=> {
    if (arr.length <= 1) {
        return arr;
    }
    let pivotIndex = Math.floor(arr.length / 2);
    let pivot = arr.splice(pivotIndex, 1)[0];
    let left = [], right = [];
    for (let ai of arr) {
        if (ai < pivot) {
            left.push(ai);
        } else {
            right.push(ai);
        }
    }
    return quickSort(left).concat([pivot], quickSort(right));
};
水壶问题
1.依次从红色水壶中选取一个水壶与蓝色水壶集合对比，对比过程如下：
2.红色水壶与每一个蓝色水壶对比，盛水量大于红色水壶的蓝水壶放在右边，小于的放在左边，水量相等的为当前集合的 「基准」 元素。
3.如果当前集合中已有 「基准」 元素，则拿红色水壶与「基准」元素对比： 红色水壶大于基准元素，则选取基准元素右边的集合重复第二步; 如果红色水壶小于基准元素，则选取基准元素左边边的集合重复第二步。
举个栗子
现在有红色水壶容量为： [3, 5, 1, 4, 8, 2, 6]
蓝色水壶： [6, 2, 3, 1, 8, 5, 4]
第一步，选取红色水壶中第一个水壶 3 跟蓝色水壶依次对比，大于 3 的放右边，小于 3 的放左边，等于 3 的水壶为当前集合的 「基准」 元素。
1
[2, 1, ③, 6, 8, 5, 4]
然后选取红色水壶中的第二个水壶 5 与 「基准」 元素对比，5 > 3, 因此使用第一步的方法，拿 5 与 「基准」 元素右边的元素依次对比。
1
[2, 1, ③, 4, ⑤, 6, 8]
红色第三个水壶为 1， 拿 1 与第一个 「基准」 元素比较， 1 < 3, 因此使用第一步的方法， 拿 1 与 「基准」 元素左边的元素依次对比。
1
[①, 2, ③, 4, ⑤, 6, 8]
红色第四个水壶为 4， 拿 4 与第一个 「基准」 元素比较， 4 > 3, 因此使用第一步的方法， 拿 4 与 「基准」 元素右边的元素依次对比。
右边元素集合中又有 「基准」 元素 5 ，因此先与 「基准」 元素对比， 4 < 5， 所以拿 4 与 「基准」 元素左边的元素依次对比。
1
[①, 2, ③, ④, ⑤, 6, 8]
后面的顺序为
1
2
3
4
5
[①, 2, ③, ④, ⑤, 6, ⑧]

[①, ②, ③, ④, ⑤, 6, ⑧]

[①, ②, ③, ④, ⑤, ⑥, ⑧]
代码描述：
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
'use strict';

Array.prototype.pivot = -1;
const quickMatch = (key, arr) => {
    if (arr.length <= 1) {
        console.log(`${key} matched!`);
        return;
    }
    if (arr.pivot < 0) {
        arr.left = new Array();
        arr.right = new Array();
        arr.map(ai=> {
            if (ai < key) {
                arr.left.push(ai);
            } else if (ai > key) {
                arr.right.push(ai);
            } else if (ai === key) {
                arr.pivot = key;
                console.log(`${key} matched!`)
            }
        });
    } else {
        if (key > arr.pivot) {
            quickMatch(key, arr.right);
        } else if (key < arr.pivot) {
            quickMatch(key, arr.left);
        }
    }
};
测试：
1
2
3
4
5
6
let arrRed = [3, 5, 1, 4, 8, 2, 6];
let arrBlue = [6, 2, 3, 1, 8, 5, 4];

for (let key of arrRed) {
    quickMatch(key, arrBlue);
}
总结
这个算法有点类似于二叉树的思想，将红色水壶与蓝色水壶依次对比的时候，构建蓝色水壶二叉树，每个二叉树的根结点为红色水壶。平均时间复杂度为O(nlgn)。


HTML5 前端存储
2016-11-16T00:33:38.000Z
Cookie, LocalStorage 与 SessionStorage
基本概念
Cookie，指某些网站为了辨别用户身份而储存在用户本地终端（Client Side）上的数据（通常经过加密）。
html5 中的 Web Storage 包括了两种存储方式：sessionStorage和localStorage。
sessionStorage 用于本地存储一个会话（session）中的数据，这些数据只有在同一个会话中的页面才能访问并且当会话结束后数据也随之销毁。因此 sessionStorage 不是一种持久化的本地存储，仅仅是会话级别的存储。
而 localStorage 用于持久化的本地存储，除非主动删除数据，否则数据是永远不会过期的。浏览器中同一个域下的窗口可以共享 localStorage 数据。
兼容性
特性 Chrome Firefox (Gecko) Internet Explorer Opera Safari (WebKit)
localStorage 4 3.5 8 10.50 4
sessionStorage 5 2 8 10.50 4
差别
Cookie 一般由服务器生成，可设置失效时间。如果在浏览器端生成 Cookie，默认是关闭浏览器后失效。Http 通信的时候 Cookie 的信息会保存的 Http 头中。
localStorage 和 sessionStorage 仅在客户端（即浏览器）中保存，不参与和服务器的通信。
应用场景
因为每个 HTTP 请求都会带着 Cookie 的信息，所以 Cookie 应当尽可能精简，比较常用的一个应用场景就是判断用户是否登录。针对登录过的用户，服务器端会在他登录时往 Cookie 中插入一段加密过的唯一辨识单一用户的辨识码，下次只要读取这个值就可以判断当前用户是否登录啦。
localStorage 主要存储一些比较多的本地数据，如 HTML5 小游戏里面生成的数据。
如果遇到一些内容特别多的表单，为了优化用户体验，我们可能要把表单页面拆分成多个子页面，然后按步骤引导用户填写。这时候 sessionStorage 的作用就发挥出来了。
安全性的考虑
需要注意的是，不是什么数据都适合放在 Cookie、localStorage 和 sessionStorage 中的。使用它们的时候，需要时刻注意是否有代码存在 XSS 注入的风险。因为只要打开控制台，你就随意修改它们的值，所以千万不要用它们存储你系统中的敏感数据。


Python一些书写技巧
2016-11-13T21:36:55.000Z
简介
本文介绍了一些平时用到的Python书写技巧。之后会不断更新。
交换变量
1
2
3
4
5
6
x = 6
y = 5
 
x, y = y, x
 
print(x, y) #5 6
if 语句在行内
1
print("Hello") if True else "World" #Hello
连接
1
2
3
4
5
6
7
8
9
10
11
a = [1, 2]
b = [3, 4]
print(a + b) #[1, 2, 3, 4]
 
print(str(1) + " world") #1 world
 
print(`1` + " world") #1 world
 
print(1, "world") #1 world

print(a, 3) #[1, 2] 3
除法
1
2
3
4
5
print(5.0//2) #2 地板除
print(2**5) #32 2的5次方

print(.3/.1) #2.9999999999999996
print(.3//.1) #2.0
数值比较
1
2
3
4
5
6
x = 2
if 3 > x > 1:
   print(x) #2

if 1 < x > 0:
   print(x) #2
迭代列表
1
2
3
4
5
6
7
8
9
10
11
12
13
14
names = ('Jack','Leo','Sony')
ages = (2001,2002,2003)
for a, n in zip(names, ages):
    print(a, n)
#Jack 2001
#Leo 2002
#Sony 2003

# 索引
for index, a in enumerate(names):
    print(index, a)
#0 Jack
#1 Leo
#2 Sony
列表推导式
已知一个列表，我们可以筛选出偶数列表方法：
1
2
3
4
5
6
7
8
numbers = [1,2,3,4,5,6]
even = []
for number in numbers:
    if number%2 == 0:
        even.append(number)

#转变成如下：
even = [number for number in numbers if number%2 == 0]
字典推导
和列表推导类似，字典可以做同样的工作：
1
2
3
4
names = ['Jack','Leo','Sony']
people = [{key: value for value, key in enumerate(names)}]
print(people)
>>> [{'Sony': 2, 'Leo': 1, 'Jack': 0}]
初始化列表的值
1
2
3
items = [0]*3
print(items)
>>> [0,0,0]
列表转换为字符串
1
2
3
names = ["Leo", "Jack", "Lucy"]
print(", ".join(names))
>>> Leo, Jack, Lucy
从字典中获取元素
1
2
3
4
data = {'user': 1, 'name': 'Max', 'age': 4}
is_admin = data.get('admin', False)
print(is_admin)
>>> False
切片
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
x = [1,2,3,4,5,6]
#前3个
print(x[:3])
>>> [1,2,3]
#中间4个
print(x[1:5])
>>> [2,3,4,5]
#最后3个
print(x[-3:])
>>> [4,5,6]
#奇数项
print(x[::2])
>>> [1,3,5]
#偶数项
print(x[1::2])
>>> [2,4,6]
一行代码解决FizzBuzz
有一个简单的编程练习叫FizzBuzz，问题引用如下：
写一个程序，打印数字1到100，3的倍数打印“Fizz”来替换这个数，5的倍数打印“Buzz”，对于既是3的倍数又是5的倍数的数字打印“FizzBuzz”。
这里就是一个简短的，有意思的方法解决这个问题：
1
for x in range(101):print("fizz"[x%3*4::]+"buzz"[x%5*4::]or x)
集合
除了python内置的数据类型外，在collection模块同样还包括一些特别的用例，在有些场合Counter非常实用。
1
2
3
from collections import Counter
print(Counter("hello"))
>>> Counter({'l': 2, 'h': 1, 'e': 1, 'o': 1})
迭代工具
和collections库一样，还有一个库叫itertools，对某些问题真能高效地解决。其中一个用例是查找所有组合，他能告诉你在一个组中元素的所有不同的组合方式
1
2
3
4
5
6
7
from itertools import combinations
names = ["Leo", "Jack", "Lucy"]
for name in combinations(names, 2):
    print(name)
>>> ('Leo', 'Jack')
>>> ('Leo', 'Lucy')
>>> ('Jack', 'Lucy')
False == True
在Python中，True和False是全局变量，因此：
1
2
3
4
5
6
False = True
if False:
   print("Hello")
else:
   print("World")
>>> Hello



换了一个 Blog 主题
2016-11-11T09:17:09.000Z
yilia
前几天deploy博客的时候，发现打开blog页面是空的，只有head部分显示出来了。打开控制台排查问题，发现hexo主题里面有几个外部ajax call失败，导致整个页面都没有渲染出来，这是一件恼火的事情。
于是果断换主题，其实对之前的主题还是很满意的： 简洁，渲染速度也很快，功能虽然不多，但是基本满足我的需求。
这次选择的主题是腾讯的工程师Litten制作的 「yilia」
「yilia」 同样是我喜欢的简洁样式，作者甚至移除了搜索框。而且对于移动端的优化也做得很不错。
yotuku
之前Blog里面的图片一直都选择 「yotuku」 生成在线图片，然后在markdown里面引用，如果图片大小或者位置不合适的话，会在md里面手写一段html，这样做很省事。
今天早上看自己的Blog发现有几张图片没有加载出来，以为是新主题渲染的问题，重新deploy以后发现还是没有。看来不是主题的锅。
使用控制台发现
原来这几张图片都没有拿到，已经在官网留言，希望能够解决。
不过使用免费云服务存储自己Blog的图片确实不太安全，像这样丢失图片的行为可能会导致几张图片加载不出来，但是如果以后云服务提供商挂掉了（这里不是诅咒yutuku不好，希望这样良心企业越来越好），那这些图片岂不就再也找不到了。
还是老老实实把图片放到Blog路径下，用相对地址引用吧。


JavaScript 严格模式
2016-11-09T12:58:12.000Z
简介
ECMAScript 5 引入了严格模式（strict mode）的概念。严格模式为JavaScript定义了一种不同的解析与执行模型。在严格模式下，ECMAScript 3中的一些不确定的行为将得到处理，而且对于某些不安全的操作也会抛出错误。（JavaScript高级程序设计）
设立严格模式的目的：
严格模式会将JavaScript陷阱直接变成明显的错误。
严格模式修正了一些引擎难以优化的错误。
同样的代码有些时候严格模式会比非严格模式下更快。
严格模式禁用了一些有可能在未来版本中定义的语法。
开启严格模式
使用 ‘use strict’; 进入严格模式。 严格模式可以应用到整个script标签或个别函数中。
为整个script标签开启严格模式
1
2
3
// 整个语句都开启严格模式的语法
"use strict";
console.log('严格模式script')
注意： 如果要为整个script开启严格模式，‘use strict’; 一定要放在第一行。 如果担心文件合并带来严格模式与正常模式的混合，可以将script写成自执行函数的形式。
为某个函数开启严格模式
1
2
3
4
5
6
7
function strict() {
    "use strict";　　
    return "严格模式函数";
}
function notStrict() {
    return "正常模式函数";
}
严格模式有哪些不同
全局变量显式声明
在正常模式下，如果一个变量未声明就直接赋值，相当于创建一个全局变量。这给新人开发者带来便利的同时，给整个项目留下巨大隐患。严格模式将这种失误当成错误。
1
2
'use strict';
a = '严格模式';  //ReferenceError: a is not defined
不再Silently Fail
严格模式会使引起静默失败(silently fail,注:不报错也没有任何效果)的赋值操作抛出异常。
不可变量赋值
例如： NaN 是一个不可写的全局变量. 在正常模式下, 给 NaN 赋值不会产生任何作用; 开发者也不会受到任何错误反馈. 但在严格模式下, 给 NaN 赋值会抛出一个异常。
1
2
'use strict';
NaN = 3; //TypeError: Cannot assign to read only property 'NaN' of #
给不可写属性赋值, 给只读属性(getter-only)赋值赋值, 给不可扩展对象(non-extensible object)的新属性赋值) 都会抛出异常:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
"use strict";

// 给不可写属性赋值
var obj1 = {};
Object.defineProperty(obj1, "x", {
    value: 42,
    writable: false
});
obj1.x = 9; // TypeError: Cannot assign to read only property 'x' of #

// 给只读属性赋值
var obj2 = {
    get x() {
        return 17;
    }
};
obj2.x = 5; // TypeError: Cannot set property x of # which has only a getter

// 给不可扩展对象的新属性赋值
var fixed = {};
Object.preventExtensions(fixed);
fixed.newProp = "haha"; // TypeError: Can't add property newProp, object is not extensible
删除不可删除属性
在严格模式下, 试图删除不可删除的属性时会抛出异常(之前这种操作不会产生任何效果)
1
2
"use strict";
delete Object.prototype; //TypeError: Cannot delete property 'prototype' of function Object()
参数名唯一
严格模式要求函数的参数名唯一。在正常模式下, 最后一个重名参数名会掩盖之前的重名参数。 之前的参数仍然可以通过 arguments[i] 来访问。
1
2
3
4
function sum(a, a, c) { //SyntaxError: Strict mode function may not have duplicate parameter names
    "use strict";
    return a + b + c;
}
禁止八进制数字语法
1
2
3
4
"use strict";
var sum = 015 + // SyntaxError: Octal literals are not allowed in strict mode.
          197 +
          142;
简化变量的使用
禁用 with
先看一个with的例子：
1
2
3
4
5
6
7
8
9
var x = 17;
var obj = {
    //x: 4
};
with(obj) {
    x = 2;
}

console.log(x);
结果是2， with块内x为全局变量x。
1
2
3
4
5
6
7
8
9
var x = 17;
var obj = {
    x: 4
};
with(obj) {
    x = 2;
}

console.log(x);
结果是17， with块内x为变量obj.x。
所以with中块内的x究竟是指全局变量x还是obj.x在运行之前是无法得知的，这对编译器优化十分不利，因此严格模式禁用 with。
eval作用域
严格模式下的 eval 不在为上层范围(surrounding scope,注:包围eval代码块的范围)引入新变量。
在正常模式下,  代码 eval(“var x;”) 会给上层函数(surrounding function)或者全局引入一个新的变量 x 。
严格模式下，eval语句本身就是一个作用域，它所生成的变量只能用于eval内部。
1
2
3
4
5
6
7
var x = 17;
var evalX = eval("'use strict'; var x = 32; x");
console.log(x); //17

var y = 17;
var evalY = eval("var y = 32; y");
console.log(y); //32
禁止删除声明变量
严格模式禁止删除声明变量。delete name 在严格模式下会引起语法错误
1
2
3
4
5
6
"use strict";

var x;
delete x; // SyntaxError: Delete of an unqualified identifier in strict mode.

eval("var x; delete x;"); // SyntaxError
让eval和arguments变的简单
绑定或赋值
eval 和 arguments 不能通过程序语法被绑定或赋值。 以下的所有尝试将引起语法错误:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
"use strict";
eval = 17;
arguments++;
++eval;
var obj = {
    set p(arguments) {}
};
var eval;
try {} catch (arguments) {}

function x(eval) {}

function arguments() {}
var y = function eval() {};
var f = new Function("arguments", "'use strict'; return 17;");
arguments对象
arguments对象不再追踪参数的变化
1
2
3
4
5
6
7
8
function f(a) {
    "use strict";
    a = 42;
    return [a, arguments[0]];
}
var pair = f(17);
console.assert(pair[0] === 42);
console.assert(pair[1] === 17);
不再支持 arguments.callee
正常模式下，arguments.callee 指向当前正在执行的函数。这个作用很小：直接给执行函数命名就可以了。
1
2
3
"use strict";
var f = function() { return arguments.callee; };
f(); // TypeError: 'caller', 'callee', and 'arguments' properties may not be accessed on strict mode functions or the arguments objects for calls to them
“安全的” JavaScript
严格模式下更容易写出“安全”的JavaScript。
this关键字
在严格模式下通过this传递给一个函数的值不会被强制转换为一个对象。
1
2
3
4
5
6
7
8
9
10
function f() {　　　　
    console.log(this);　　
}　
function f1() {　　　　
    "use strict";　　　　
    console.log(this);
}

f.bind(3)();  //[Number: 3]
f1.bind(3)();  //3
对一个普通的函数来说，this总会是一个对象：不管调用时this它本来就是一个对象；还是用布尔值，字符串或者数字调用函数时函数里面被封装成对象的this；还是使用undefined或者null调用函数时this代表的全局对象（使用call, apply或者bind方法来指定一个确定的this）。
这种自动转化为对象的过程不仅是一种性能上的损耗，同时在浏览器中暴露出全局对象也会成为安全隐患。
所以对于一个开启严格模式的函数，指定的this不再被封装为对象，而且如果没有指定this的话它值是undefined。
1
2
3
4
5
6
7
"use strict";
function fun() { return this; }
assert(fun() === undefined);
assert(fun.call(2) === 2);
assert(fun.apply(null) === null);
assert(fun.call(undefined) === undefined);
assert(fun.bind(true)() === true);
为未来的ECMAScript版本铺平道路
保留的关键字
在严格模式中一部分字符变成了保留的关键字。这些字符包括implements, interface, let, package, private, protected, public,
static和yield。在严格模式下，你不能再用这些名字作为变量名或者形参名。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
function package(protected) // !!!
{
    "use strict";
    var implements; // !!!

    interface: // !!!
        while (true) {
            break interface; // !!!
        }

    function private() {} // !!!
}

function fun(static) {
    'use strict';
} // !!!
函数声明
严格模式只允许在全局作用域或函数作用域的顶层声明函数。也就是说，不允许在非函数的代码块内声明函数。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
"use strict";
if (true)
{
  function f() { } // !!! 语法错误
  f();
}
for (var i = 0; i < 5; i++)
{
  function f2() { } // !!! 语法错误
  f2();
}
function baz() // 合法
{
  function eit() { } // 同样合法
}
总结
严格模式虽然限制了一部分JavaScript书写和运行的自由，但是随着JavaScript在更大的工程中扮演更重要的角色，规范化是必经之路。
参考链接
MDN严格模式
Javascript 严格模式详解


JavaScript 递归优化
2016-11-03T00:35:34.000Z
背景
在之前的项目 Regional Guideline 中，有一个操作点击 Ext 树的一个结点，展开这个结点的全部子树（树的深度未知），刚开始看到 TreeNode 中有一个名为 expand 的 Public Method， 其API如下：

[公司使用的版本为ExtJS 3.3]
简单明了，expand 第一个参数 deep 是一个 Boolean 型参数，如果为true的话，就展开当前结点以及子结点的所有子结点。
于是没有多加思考就用了。在开发测试环节一直没有出现什么问题，可是到了 Production 测试，帮忙测试的同学发现： 在操作树的时候，有时候浏览器会崩溃。刚开始以为是特殊情况，浏览器问题之类的，没有在意。可是不断地测试发现浏览器崩溃的情况是可复现的，就是在某几个固定的树展开的时候会出现这个问题。可见这不是浏览器的问题，是我代码的问题。
排查代码，发现这个 expand 方法似乎是罪魁祸首。查看ExtJS源码，果然是这个家伙的问题，原来这个函数使用递归的方式去展开所有的子结点，而当子结点比较多的时候，内存和CPU的消耗变得非常大，于是浏览器就崩溃了。
分析问题
首先查看 ExtJS 源码， TreeNode 中的 expand 方法的源码如下
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
/**
 * Expand this node.
 * @param {Boolean} deep (optional) True to expand all children as well
 * @param {Boolean} anim (optional) false to cancel the default animation
 * @param {Function} callback (optional) A callback to be called when
 * expanding this node completes (does not wait for deep expand to complete).
 * Called with 1 parameter, this node.
 * @param {Object} scope (optional) The scope (this reference) in which the callback is executed. Defaults to this TreeNode.
 */
expand : function(deep, anim, callback, scope){
    if(!this.expanded){
        if(this.fireEvent('beforeexpand', this, deep, anim) === false){
            return;
        }
        if(!this.childrenRendered){
            this.renderChildren();
        }
        this.expanded = true;
        if(!this.isHiddenRoot() && (this.getOwnerTree().animate && anim !== false) || anim){
            this.ui.animExpand(function(){
                this.fireEvent('expand', this);
                this.runCallback(callback, scope || this, [this]);
                if(deep === true){
                    this.expandChildNodes(true, true);
                }
            }.createDelegate(this));
            return;
        }else{
            this.ui.expand();
            this.fireEvent('expand', this);
            this.runCallback(callback, scope || this, [this]);
        }
    }else{
       this.runCallback(callback, scope || this, [this]);
    }
    if(deep === true){
        this.expandChildNodes(true);
    }
}
expandChildNodes 的源码如下
1
2
3
4
5
6
7
8
9
10
11
12
/**
 * Expand all child nodes
 * @param {Boolean} deep (optional) true if the child nodes should also expand their child nodes
 */
expandChildNodes : function(deep, anim) {
    var cs = this.childNodes,
        i,
        len = cs.length;
    for (i = 0; i < len; i++) {
            cs[i].expand(deep, anim);
    }
}
查看调用关系，发现 expand 方法如果传参 deep = true 的话会调用 expandChildNodes 方法去展开当前结点的子结点，而 expandChildNodes 方法又调用 expand  方法逐个展开子结点的所有子结点。 这样就变成了递归。
说说递归
假设有一个求和函数sum： sum(n) = ∑ k
循环
1
2
3
4
5
6
7
function sum(n) {
  var result = n;
  while (n > 1) {
    result += --n;
  }
  return result;
}
循环自然是速度和性能最好的，但是在编写复杂的代码时，循环代码的数学描述性不够强。
普通递归
1
2
3
4
5
6
function sum(n) {
  if (n === 1) {
    return 1;
  }
  return n + sum(--n);
}
使用上述递归的方式可以说是将代码与数学描述完美结合，以上代码给一个完全不懂编程的人也看得懂。
但是我们分析其计算过程，比如计算sum(5)的时候，其计算过程是这样的:
1
2
3
4
5
6
7
8
9
10
sum(5)
(5 + sum(4))
(5 + (4 + sum(3)))
(5 + (4 + (3 + sum(2))))
(5 + (4 + (3 + (2 + sum(1)))))
(5 + (4 + (3 + (2 + 1))))
(5 + (4 + (3 + (3))))
(5 + (4 + (6))
(5 + 10)
15
这样的计算有什么问题呢？
我们知道线程在执行代码的时候，计算机会分配一定大小的栈空间，每次方法调用时都会在栈里储存一定信息（如参数、局部变量、返回地址、调用位置等等），这些信息会占用一定空间，成千上万个此类空间累积起来，可能会导致栈溢出。
尾递归
1
2
3
4
5
6
function sum(x, total = 0) {
    if (x === 1) {
        return x + total;
    }
    return sum(--x, x + total);
}
计算 sum(5)的时候，其过程是这样的:
1
2
3
4
5
6
sum(5, 0)
sum(4, 5)
sum(3, 9)
sum(2, 12)
sum(1, 14)
15
sum() 函数多了一个 total 参数，这个参数记录在递归调用时上一次计算的结果，并将其传入下一次递归调用中。每一次函数调用都发生在函数最后一步操作，所以不需要保留外层函数的调用记录，因为调用位置、内部变量等信息都不会再用到了，只要直接用内层函数的调用记录，取代外层函数的调用记录就可以了。
函数在尾部调用自身，就称为尾递归。
尾递归的本质，其实是将递归方法中的需要的“所有状态”通过方法的参数传入下一次调用中。
与普通递归相比，由于尾递归的调用处于方法的最后，因此方法之前所积累下的各种状态对于递归调用结果已经没有任何意义，因此完全可以把本次方法中留在堆栈中的数据完全清除，把空间让给最后的递归调用。这样的优化使得递归不会在调用堆栈上产生堆积，意味着即使是“无限”递归也不会让堆栈溢出。这便是尾递归的优势。
ES6 对尾递归的支持
ES6 中将会资磁zīcí尾递归优化，通过尾递归优化，JavaScript 代码在解释成机器码的时候，会将尾递归函数解释成 while 函数，达到写的时候表达性强，运行的时候速度高的效果。
下面来看 Babel 编译的效果，将上述为递归的 sum 函数编译后如下：
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
"use strict";
function sum(_x2) {
    var _arguments = arguments;
    var _again = true;

    _function: while (_again) {
        var x = _x2;
        _again = false;
        var total = _arguments.length <= 1 || _arguments[1] === undefined ? 0 : _arguments[1];

        if (x === 1) {
            return x + total;
        }
        _arguments = [_x2 = --x, x + total];
        _again = true;
        total = undefined;
        continue _function;
    }
}
严格模式
ES6的尾递归优化只在严格模式下开启，正常模式是无效的。
这是因为在正常模式下，函数内部有两个变量，可以跟踪函数的调用栈。
* arguments：返回调用时函数的参数。* func.caller：返回调用当前函数的那个函数。
尾调用优化发生时，函数的调用栈会改写，因此上面两个变量就会失真。严格模式禁用这两个变量，所以尾调用模式仅在严格模式下生效。
解决问题
回到最早的问题，如何高效地展开一棵不知深浅的树？
当时并没有尾递归方面的知识，而且改 Ext 源码也不是那么方便，于是通过 Google 知道了一个比较好的解决方案：使用栈代替递归。
怎么做呢？
要展开一棵树，首先将树的根结点入栈，然后一个节点一个节点出栈，每次出栈后，将出栈节点的所有子节点入栈，以此达到遍历一颗树的效果。出栈的过程中逐一展开当前节点的字结点。
1
2
3
4
5
6
7
8
9
10
11
expandAllChildNodes: function(node) {
    var nodeStack = [];
    nodeStack.push(node);
    while (nodeStack.length > 0) {
        var nodeTop = nodeStack.pop();
        if (nodeTop.hasChildNodes()) {
            nodeTop.expand();
            nodeStack = nodeStack.concat(nodeTop.childNodes);
        }
    }
}
这个方法将递归转化为栈，可读性也不是很差，算是一个不错的解决方案。测试发现之前几个导致浏览器崩溃的树都可以完美展开，O(∩_∩)O~~。
总结
递归本质上是一种循环操作。纯粹的函数式编程语言没有循环操作命令，所有的循环都用递归实现，这就是为什么尾递归对这些语言极其重要。
循环代表着高效，递归代表着易读，如果能将递归方便地转化为循环是想必那是极好的，可是如果转化不是那么方便的话，尽量使用尾递归。


JavaScript 异步解决方案 async/await
2016-11-01T22:54:01.000Z
简介
异步操作一直都是 JavaScript 中一个比较麻烦的事情，从最早的 callback hell，到TJ大神的 co，再到 Promise 对象，然后ES6中的 Generator 函数，每次都有所改进，但都不是那么彻底，而且理解起来总是很复杂。
直到 async/await 出现，让写异步的人根本不用关心它是不是异步，可以说是目前最好的 JavaScript 异步解决方案。
ECMAScript 2016(ES7) 中已经确定支持 async/await，那我们怎么能够落后呢？
本文是 async/await 的学习笔记，涵盖基本用法以及一些小 demo。
async 函数是什么
阮一峰的 Blog async 函数的含义和用法, 对async的定义一语中的：async 函数就是 Generator 函数的语法糖。
假如有一个Generator函数：
1
2
3
4
5
6
7
8
9
10
11
12
13
'use strict';
const f = (time) => {
    return new Promise(function (resolve) {
        setTimeout(() => {
            resolve(time);
        }, time);
    });
};

const gen = function* () {
    const f1 = yield f(1000);
    const f2 = yield f(2000);
};
调用方法:
1
2
3
4
5
6
7
8
9
10
let generator = gen();

let ret = generator.next();
ret.value.then((data)=> {
    console.log(data);
    let ret1 = generator.next(data);
    ret1.value.then(function (data) {
        generator.next(data);
    })
});
将 gen 函数写成 async 函数，就是下面这样:
1
2
3
4
const asyncF = async(()=> {
    let f1 = await(f(1000));
    let f2 = await(f(2000));
});
一比较就会发现，async 函数就是将 Generator 函数的星号（*）替换成 async，将 yield 替换成 await，仅此而已。
说明
由于目前的大部分浏览器和 NodeJS 环境还不支持 async/await，所以本文程序借助 “asyncawait” 实现，需要额外安装
1
$ npm install asyncawait
当然如果你对 babel 比较熟悉的话，也可以通过 babel 将 async/await 编译为 ES5，就可直接运行了。
async/await 使用规则
async 表示这是一个async函数，await只能用在这个函数里面。
await 如果后面是异步函数，跟在后面的应该是一个Promise对象。
await 表示在这里等待Promise返回结果了，再继续执行。
获得返回值
可以看到使用 Generator 的时候获取返回值必须使用 .then() 方法，而使用 async/await 就简单很多：
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
'use strict';
let async = require('asyncawait/async');
let await = require('asyncawait/await');

const f = (time) => {
    return new Promise(function (resolve) {
        setTimeout(() => {
            resolve(time);
        }, time);
    });
};

(async(()=> {
    let f1 = await(f(1000));
    console.log(f1);
    let f2 = await(f(2000));
    console.log(f2);
}))();
await 等待的虽然是 promise 对象，但不必写使用 .then()，也可以得到返回值。
捕捉异常
既然 .then() 不用写了，那 .catch()也不用写，可以直接用标准的try
catch语法捕捉错误
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
const f = (time) => {
    return new Promise(function (resolve, reject) {
        setTimeout(() => {
            reject(new Error('error'));
        }, time);
    });
};

(async(()=> {
    try {
        await(f(3000));
    } catch (err) {
        console.log(err.message); // 这里捕捉到错误 `error`
    }
}))();
await 命令后面的 Promise 对象，运行结果可能是 rejected，所以最好把 await 命令放在 try…catch 代码块中
循环使用 await
await 最好用的地方是可以写在 for 循环里面，这是Promise无法做到的，使得 async/await 看起来更像是同步代码
1
2
3
4
5
6
7
8
9
10
11
12
13
const f = (time) => {
    return new Promise(function (resolve) {
        setTimeout(() => {
            resolve(time);
        }, time);
    });
};
(async(()=> {
    for (var i = 1; i <= 10; i++) {
        console.log(`当前是第${i}次等待..`);
        await(f(1000));
    }
}))();

属性	描述	效果
flex-direction: row	（默认值）主轴为水平方向，起点在左端
flex-direction: row-reverse	主轴为水平方向，起点在右端
flex-direction: column	主轴为垂直方向，起点在上沿
flex-direction: column-reverse	主轴为垂直方向，起点在下沿

属性	描述	效果
flex-wrap: nowrap	（默认）不换行
flex-wrap: wrap	换行，第一行在上方
flex-wrap: wrap-reverse	换行，第一行在下方

属性	描述	效果
justify-content: flex-start	（默认）起始端对齐
justify-content: flex-end	末尾段对齐
justify-content: center	居中对齐
justify-content: space-around	子容器沿主轴均匀分布，位于首尾两端的子容器到父容器的距离是子容器间距的一半。
justify-content: space-between	子容器沿主轴均匀分布，位于首尾两端的子容器与父容器相切。

属性	描述	效果
align-items: flex-start	交叉轴的起点对齐
align-items: flex-end	交叉轴的终点对齐
align-items: center	交叉轴的中点对齐
align-items: baseline	基线对齐（首行文字对齐）所有子容器向基线对齐，交叉轴起点到元素基线距离最大的子容器将会与交叉轴起始端相切以确定基线。
align-items: stretch	（默认）如果子容器未设置高度或设为auto，子容器沿交叉轴方向的尺寸拉伸至与父容器一致

属性	参照
width & height	宽和高在使用百分比值时，其参照一般都是父元素的 content 的宽和高。
margin & padding	margin 和 padding，其任意方向的百分比值，参照都是包含块的宽度。
border-radius	为一个元素的border-radius定义的百分比值，参照物是这个元素自身的尺寸。border-radius:50%;
font-size	参照是直接父元素的 font-size。
line-height	参照是元素自身的font-size
vertical-align	参照是元素自身的line-height
bottom、left、right、top	参照是元素的包含块。left和right是参照包含块的宽度，bottom和top是参照包含块的高度。
transform: translate	参照是元素自己的边界框的尺寸

作用	NPM 命令	Yarn 命令
初始化	npm init	yarn init
安装 package.json 中的包	npm install	yarn
安装某个包	npm install xxx --save	yarn add xxx
删除某个包	npm uninstall xxx --save	yarn remove xxx
开发模式下安装某个包	npm install xxx --save-dev	yarn add xxx -dev
更新	npm update --save	yarn upgrade
全局安装	npm install xxx –global	yarn global add xxx
清除缓存	npm cache clean	yarn cache clean
查看模块信息	npm info xxx	yarn info xxx
运行script	npm run	yarn run
测试	npm test	yarn test

函数	描述
Object.assign(target, …sources)	将来自一个或多个源对象中的值复制到一个目标对象。
Object.create(prototype, descriptors)	创建具有指定原型并可选择包含指定属性的对象。
Object.defineProperties(obj, props)	将一个或多个属性添加到对象，和/或修改现有属性的特性。
Object.defineProperty(obj, prop, descriptor)	将属性添加到对象，或修改现有属性的特性。
Object.freeze(obj)	防止修改现有属性的特性和值，并防止添加新属性。
Object.getOwnPropertyDescriptor(obj, prop)	返回数据属性或访问器属性的定义。
Object.getOwnPropertyNames(obj)	返回对象属性及方法的名称。
Object.getOwnPropertySymbols(obj)	返回对象的符号属性。
Object.getPrototypeOf(obj)	返回对象的原型。
Object.is(value1, value2)	返回一个值，该值指示两个值是否相同。
Object.isExtensible(obj)	返回指示是否可将新属性添加到对象的值。
Object.isFrozen(obj)	如果无法在对象中修改现有属性的特性和值，并且无法将新属性添加到对象，则返回 true。
Object.seal(obj)	防止修改现有属性的特性，并防止添加新属性。
Object.isSealed(obj)	如果无法在对象中修改现有属性特性，并且无法将新属性添加到对象，则返回 true。
Object.keys(obj)	返回对象的可枚举属性和方法的名称。
Object.preventExtensions(obj)	防止向对象添加新属性。
Object.setPrototypeOf(obj, prototype)	设置对象的原型。