如何调用 Hadoop API获取运行任务状态问题

2025-03-15 16:23:08
推荐回答(1个)
回答1:

你用的哪个版本?

从Hadoop提供的jobtracker.jsp获取需要的信息,这里遇到的一个问题是里面使用了application作用域

JobTracker tracker = (JobTracker) application.getAttribute("job.tracker");

而Jetty服务器是嵌入到Hadoop的内部的,

如果想通过jsp页面获取统计信息的话,必须绕开Jetty服务器,或者在修改Jobtracker的中返回infoServer的一个引用,在代码中实现,不过显然这个需要修改Hadoop的核心代码,灵活性不高。

新版本hadoop Cluster类有开放的API