Android 消息机制解析

一、前言


 Android 应用开发中离不开 Handler 来处理一些逻辑任务,比如发送延迟消息处理业务等,而 Handler 实际上最终是将 Message 交给 MessageQueue,我们常用的图片加载缓存库等内部也是通过 Handler 最终由后台加载线程切换到主线程(UI 线程)来更新页面的。MessageQueue 是 Android 消息机制的核心,熟悉 MessageQueue 能够帮助我们更清楚详细地理解 Android 的消息机制。

二、流程


Android的消息机制的总体流程就是:Handler 向 MessageQueue 发送一条消息(即插入一条消息),MessageQueue通过 next 方法把消息传给 Looper,Looper 收到消息后开始处理,然后最终交给 Handler 自己去处理。换句话说就是:Handler给自己发送了一条消息,然后自己的handleMessage方法处理消息,只是中间过程经过了MessageQueue和Looper。调用的方法过程如下:Handler.sendMessage –> Handler.enqueueMessage –> MessageQueue.next –> Looper.loop–> handler.dispatchMessage –> Handler.handleMessage(或者Runnable的run方法或者Callback.handleMessage)。

下面是我找的一个比较详细的图,唯一缺少流程的就是 Handler 往 MessageQueue 中插入 Message,这里我们知道就行。

Android 消息机制解析

三、MessageQueue 原理


MessageQueue 主要包含两个操作:插入和读取。读取操作本身会伴随着删除操作,插入和读取对应的方法分别为 enqueueMessage 和 next,其中 enqueueMessage 的作用是往消息队列中插入一条消息,而 next 的作用是从消息队列中取出一条消息并将其从消息队列中移除。尽管 MessageQueue 叫消息队列,但是它的内部实现并不是用的队列,实际上它是通过一个单链表的数据结构来维护消息列表,单链表在插入和删除上比较有优势。

enqueueMessage 的主要操作其实就是单链表的插入操作,这里不贴出源码了,下面看一下 next 方法的实现:

Message next() {
    int pendingIdleHandlerCount = -1; // -1 only during first iteration
    int nextPollTimeoutMillis = 0;
    for (;;) {
        if (nextPollTimeoutMillis != 0) {
            Binder.flushPendingCommands();
        }
        nativePollOnce(ptr, nextPollTimeoutMillis);
        synchronized (this) {
            // Try to retrieve the next message.  Return if found.
            final long now = SystemClock.uptimeMillis();
            Message prevMsg = null;
            Message msg = mMessages;
            if (msg != null && msg.target == null) {
                // Stalled by a barrier.  Find the next asynchronous message in the queue.
                do {
                    prevMsg = msg;
                    msg = msg.next;
                } while (msg != null && !msg.isAsynchronous());
            }
            if (msg != null) {
                if (now < msg.when) {
                    // Next message is not ready.  Set a timeout to wake up when it is ready.
                    nextPollTimeoutMillis = (int) Math.min(msg.when - now, Integer.MAX_VALUE);
                } else {
                    // Got a message.
                    mBlocked = false;
                    if (prevMsg != null) {
                        prevMsg.next = msg.next;
                    } else {
                        mMessages = msg.next;
                    }
                    msg.next = null;
                    if (false) Log.v("MessageQueue", "Returning message: " + msg);
                    return msg;
                }
            } else {
                // No more messages.
                nextPollTimeoutMillis = -1;
            }
        }
    }
}

 可以发现 next 方法是一个无限循环的方法,如果消息队列中没有消息,那么 next 方法会一直阻塞在这里。当有新消息到来时,next 方法会返回这条消息并将其从单链表中移除。

四、Looper 原理


 Looper 在消息机制中扮演着消息循环的角色,具体来说就是它不会不停地从 MessageQueue 中查看是否有新消息,如果有新消息就会立刻处理,否则就一直阻塞在那里。首先看一下它的构造方法:

private Looper(boolean quitAllowed) {
    mQueue = new MessageQueue(quitAllowed);
    mThread = Thread.currentThread();
}

 在构造方法中它会创建一个 MessageQueue,然后将当前线程的对象保存起来。

我们知道 Handler 的工作需要 Looper,没有 Looper 的线程就会报错,那么如何为一个线程创建 Looper 呢。其实很简单,通过 Looper.prepare() 即可为当前线程创建一个 Looper,接着通过 Looper.loop() 来开启消息循环,如下:

new Thread(){
    @Override
    public void run(){
        Looper.prepare();
        Handler handler = new Handler();
        Looper.loop();
    }
}

 Looper 除了 prepare 方法外,还提供了 prepareMainLooper 方法,这个方法主要是给主线程也就是 ActivityThread 创建 Looper 使用的,其本质也是通过 prepare 方法来实现的。由于主线程的 Looper 比较特殊,所以 Looper 提供了一个 getMainLooper 方法,通过它可以在任何地方获取到主线程的 Looper。

static final ThreadLocal<Looper> sThreadLocal = new ThreadLocal<Looper>();

private static void prepare(boolean quitAllowed) {
    if (sThreadLocal.get() != null) {
        throw new RuntimeException("Only one Looper may be created per thread");
    }
    sThreadLocal.set(new Looper(quitAllowed));
}

public static void prepareMainLooper() {
    prepare(false);
    synchronized (Looper.class) {
        if (sMainLooper != null) {
            throw new IllegalStateException("The main Looper has already been prepared.");
        }
        sMainLooper = myLooper();
    }
}

public static Looper myLooper() {
    return sThreadLocal.get();
}

 通过以上代码我们可以发现,一个线程是只能创建一个 Looper 的,否则会抛出异常。另外,Looper 的存取是用的 ThreadLocal。ThreadLocal 是什么呢?简单来说,它是一个线程内部的数据存取类,通过它可以再指定的线程中存储数据,数据存储以后,只有在指定线程中可以获取到存储的数据,对于其他线程来说则无法获取到数据。在下面小节会更详细的介绍。

Looper 也是可以退出的,Looper 提供了 quit 和 quitSafely 来退出一个 Looper,二者的区别是:quit 会直接退出 Looper,而 quitSafely 只是设定一个退出标记,然后把消息队列中的已有消息处理完毕后才安全地退出。Looper 退出后,通过 Handler 发送的消息会失败,这个时候 Handler 的 send 方法会返回 false。在子线程中,如果手动为其创建了 Looper,那么在所有的事情完成以后应该调用 quit 方法来终止消息循环,否者这个子线程就会一直处于等待的状态,而如果退出了 Looper 以后,这个线程就会立刻终止,因此建议不需要的时候终止 Looper。

Looper 最重要的一个方法是 loop 方法,只有调用了 loop 后,消息循环系统才会真正的起作用,代码如下:

public static void loop() {
    final Looper me = myLooper();
    if (me == null) {
        throw new RuntimeException("No Looper; Looper.prepare() wasn't called on this thread.");
    }
    final MessageQueue queue = me.mQueue;

    // Make sure the identity of this thread is that of the local process,
    // and keep track of what that identity token actually is.
    Binder.clearCallingIdentity();
    final long ident = Binder.clearCallingIdentity();

    for (;;) {
        Message msg = queue.next(); // might block
        if (msg == null) {
            // No message indicates that the message queue is quitting.
            return;
        }

        // This must be in a local variable, in case a UI event sets the logger
        Printer logging = me.mLogging;
        if (logging != null) {
            logging.println(">>>>> Dispatching to " + msg.target + " " +
                    msg.callback + ": " + msg.what);
        }

        msg.target.dispatchMessage(msg);

        if (logging != null) {
            logging.println("<<<<< Finished to " + msg.target + " " + msg.callback);
        }

        // Make sure that during the course of dispatching the
        // identity of the thread wasn't corrupted.
        final long newIdent = Binder.clearCallingIdentity();
        if (ident != newIdent) {
            Log.wtf(TAG, "Thread identity changed from 0x"
                    + Long.toHexString(ident) + " to 0x"
                    + Long.toHexString(newIdent) + " while dispatching to "
                    + msg.target.getClass().getName() + " "
                    + msg.callback + " what=" + msg.what);
        }

        msg.recycleUnchecked();
    }
}

 Looper 的 loop 方法的工作过程也比较好理解,loop 方法是一个死循环,唯一跳出循环的方式是 MessageQueue 的 next 方法返回了 null。当 Looper 的 quit 方法被调用时,Looper就会调出 MessageQueue 的 quit 或者 quitSafely 方法来通知消息队列退出,当消息队列被标记为退出状态时,它的 next 方法就会返回 null。也就是说,Looper 必须退出,否则 loop 方法就会无限循环下去。

loop 方法会调用 MessageQueue 的 next 方法来获取新消息,而 next 是一个阻塞操作,当没有消息时,next 方法会一直阻塞在那里,这也导致 loop 方法一直阻塞在那里。如果 MessageQueue 的 next 方法返回了新消息,而 next 是一个阻塞操作,当没有消息时,next 方法会一直阻塞在那里,这也导致 loop 方法一直阻塞在那里。如果 MessageQueue 的 next 方法返回了新消息,Looper 就会处理这条消息:msg.target.dispatchMessage(msg),这里的 msg.target 是发送这条消息的 Handler 对象,这样 Handler 发送的消息最终又交给它的 dispatchMessage 方法来处理了。但是这里不同的是,Handler 的 dispatchMessage 方法是在创建 Handler 时所使用的 Looper 中执行的,这样就成功将代码逻辑切换到指定的线程中去执行了。

五、Handler 原理


Handler 创建时会采用当前线程的 Looper 来构建内部的消息循环系统,如果当前线程没有 Looper,那么就会报错。

Handler 的工作主要包含消息的发送和接收过程。消息的发送可以通过 post 的一系列方法以及 send 的一系列方法来实现,post 的一系列方法最终也是通过 send 的一系列方法来实现的。发送一条消息的典型过程如下所示:

public final boolean sendMessage(Message msg)
{
    return sendMessageDelayed(msg, 0);
}

public final boolean sendMessageDelayed(Message msg, long delayMillis)
{
    if (delayMillis < 0) {
        delayMillis = 0;
    }
    return sendMessageAtTime(msg, SystemClock.uptimeMillis() + delayMillis);
}

public boolean sendMessageAtTime(Message msg, long uptimeMillis) {
    MessageQueue queue = mQueue;
    if (queue == null) {
        RuntimeException e = new RuntimeException(
                this + " sendMessageAtTime() called with no mQueue");
        Log.w("Looper", e.getMessage(), e);
        return false;
    }
    return enqueueMessage(queue, msg, uptimeMillis);
}

private boolean enqueueMessage(MessageQueue queue, Message msg, long uptimeMillis) {
    msg.target = this;
    if (mAsynchronous) {
        msg.setAsynchronous(true);
    }
    return queue.enqueueMessage(msg, uptimeMillis);
}

 可以发现,Handler 发送消息的过程仅仅是向消息队列中插入了一条消息 msg,这条消息的 target 存入的就是当前 Handler。MessageQueue 的 next 方法就会返回这条消息给 Looper,Looper 收到消息后就开始处理了,最终消息由 Looper 交由 Handler 处理,即 Handler 的 dispatchMessage 方法会被调用,这时 Handler 就进入了处理消息的阶段。dispatchMessage 的实现如下:

public void dispatchMessage(Message msg) {
    if (msg.callback != null) {
        handleCallback(msg);
    } else {
        if (mCallback != null) {
            if (mCallback.handleMessage(msg)) {
                return;
            }
        }
        handleMessage(msg);
    }
}

private static void handleCallback(Message message) {
    message.callback.run();
}

 Handler 处理消息的过程是这样的,首先检查 Message 的 callback 是否为 null,不为 null 就通过 handleCallback 来处理消息。Message 的 callback 是一个 Runnable 对象,实际上就是 Handler 的 post 方法所传递的 Runnable 参数,handleCallback 的逻辑也很简单。其次,检查 mCallback 是否为 null,不为 null 就调用 mCallback 的 handleMessage 方法来处理消息。Callback 是个接口。最后,调用 Handler 的 handleMessage 方法来处理消息。Handler 处理消息的过程可以归纳为一个流程图:

Android 消息机制解析

 Handler 还有一个特殊的构造方法,那就是通过一个特定的 Looper 来构造 Handler,它的代码如下:

public Handler(Looper looper) {
    this(looper, null, false);
}

 

六、ThreadLocal 原理


 

 

 

七、问题


7-1、子线程创建 Handler 报错的原因?

众所周知,在 Android 中,非 UI 线程中是不能更新 UI 的,如果在子线程中做 UI 相关操作,可能会出现程序崩溃。一般的做法是,创建一个 Message 对象,Handler 发送该 message,然后在 Handler 的 handleMessage() 方法中做 UI 相关操作,这样就成功实现了子线程切换到主线程。 

其实 Handler 主要有两个功能: 一个是刷新 UI(需要用主线程的looper) 如下:

1)如果在主线程调不带参数的实例化:Handler handler = new Handler();那么这个会默认用当前线程的looper,从而实现使用主线程Looper,实现刷新UI的功能;

 

...
Handler handler1= new Handler(){
    @Override
    public void handleMessage(Message msg) {
        if (msg.arg1==1) {
            Toast.makeText(MainActivity.this,"hanlder1",Toast.LENGTH_SHORT).show();
        }
        super.handleMessage(msg);
    }
};

new Thread(new Runnable() {
    @Override
    public void run() {
        Message message = handler1.obtainMessage();
        message.arg1 = 1;
        handler1.sendMessage(message);
    }
}).start();
...

2)如果在其他线程,也要满足刷新UI的话,要调用Handler handler = new Handler(Looper.getMainLooper()),这样虽然在子线程中初始化handler,但是仍然用的主线程的Looper对象,实现刷新UI的功能;

new Thread(new Runnable() {
    @Override
    public void run() {
        Handler handler2 = new Handler(Looper.getMainLooper()){
            @Override
            public void handleMessage(Message msg) {
                if (msg.arg1==1) {
                    Toast.makeText(MainActivity.this,"hanlder2",Toast.LENGTH_SHORT).show();
                }
                super.handleMessage(msg);
            }
        };
        Message message = handler2.obtainMessage();
        message.arg1 = 1;
        handler2.sendMessage(message);
    }
}).start();

另一个是不用刷新 UI,只是处理消息。如下:

new Thread(new Runnable() {
    @Override
    public void run() {
        Looper.prepare();
        Handler handler2 = new Handler(){
            @Override
            public void handleMessage(Message msg) {
                if (msg.arg1==1) {
                    Toast.makeText(MainActivity.this,"hanlder2",Toast.LENGTH_SHORT).show();
                }
            }
        };

        Message message = handler2.obtainMessage();
        message.arg1 = 1;
        handler2.sendMessage(message);
        Looper.loop();;
    }
}).start();

如果这里我们不调用 Looper.prepare(),直接跟在主线程中创建 Handler 一样,那么会抛出“Can't create handler inside thread that has not called Looper.prepare()” 这个异常。也可以直接拿主线程默认创建的 Looper(Looper.getMainLooper()),因为在 ActivityThread 的源码的 main()方法中会调用 Looper.prepareMainLooper()。

因此我们的结论是:主线程中可以直接创建Handler对象。 因为主线程默认会创建 Looper。子线程中需要先调用Looper.prepare(),然后创建Handler对象。

 

7-2、Looper 死循环为什么不会导致应用卡死?

对于线程即是一段可执行的代码,当可执行代码执行完成后,线程生命周期便该终止了,线程退出。而对于主线程,我们是绝不希望会被运行一段时间,自己就退出,那么如何保证能一直存活呢?简单做法就是可执行代码是能一直执行下去的,死循环便能保证不会被退出,例如,binder线程也是采用死循环的方法,通过循环方式不同与Binder驱动进行读写操作,当然并非简单地死循环,无消息时会休眠。但这里可能又引发了另一个问题,既然是死循环又如何去处理其他事务呢?通过创建新线程的方式。真正会卡死主线程的操作是在回调方法onCreate/onStart/onResume等操作时间过长,会导致掉帧,甚至发生ANR,looper.loop本身不会导致应用卡死。

主线程的死循环一直运行是不是特别消耗CPU资源呢? 其实不然,这里就涉及到Linux pipe/epoll机制,简单说就是在主线程的MessageQueue没有消息时,便阻塞在loop的queue.next()中的nativePollOnce()方法里,此时主线程会释放CPU资源进入休眠状态,直到下个消息到达或者有事务发生,通过往pipe管道写端写入数据来唤醒主线程工作。这里采用的epoll机制,是一种IO多路复用机制,可以同时监控多个描述符,当某个描述符就绪(读或写就绪),则立刻通知相应程序进行读或写操作,本质同步I/O,即读写是阻塞的。 所以说,主线程大多数时候都是处于休眠状态,并不会消耗大量CPU资源。 

 

7-3、系统为什么不允许在子线程中访问 UI?

这是因为Android的UI控件不是线程安全的,如果在多线程中并发访问可能会导致UI控件处于不可预期的状态,那么为什么系统不对UI控件的访问加上锁机制呢?缺点有两个: 

1、首先加上锁机制会让UI访问的逻辑变得复杂 

2、锁机制会降低UI访问的效率,因为锁机制会阻塞某些线程的执行。 

所以最简单且高效的方法就是采用单线程模型来处理UI操作。
 

7-4、子线程一定不能更新 UI?

而主线程不能更新UI 是因为 ViewRootImpl 的 checkThread 方法而 ViewRootImpl 的创建在 onResume 方法后。更详细的解释可以看我的另一篇博客 Android 中 Activity 的 onCreate 方法里面子线程为何能设置UI界面

7-5、如何处理 Handler 使用不当导致的内存泄露?