根据书上写的,判断一个文法是否为LL(1)文法有三点。将其实际作用结合个人理解记录如下。

  1. [文法]没有左递归;
  2. 同一非终结符推导出的多个[右侧]的FIRST集合的交集为空(显然只有一个右侧的产生式不会违反这条规则);
  3. 若[某一产生式]可以推出ε,则要求该[产生式左侧]的[FIRST集合]和[FOLLOW集合]的交集为空。

具体解释如下: 通过结合LL文法的[预测分析程序]这个实现方法的[预测分析表]可以比较直观地进行解释。LL(1)由于前看符号只有一位,可将其视作[行]为单一[非终结符],[列]为单一[终结符]的一张表格。将表格由每一固定行、列号确定的空间称作一个格子的话,则格子里放的是产生式。显然,为了由当前的分析过程和下一符号确定产生时的推导方向的话,每一个格子里只应该放最多一个产生式。当然,空下来的格子放的都是出错标记,因为当前文法不允许在该情况下进行推导。而上面的三条规则解决了如下问题:

  1. 第一条解决了格子跳转的位置问题。左递归加上最左推导,会将自身不断添加到当前推导过程的最左侧,也就是格子的跳转结果指向自己。由于文法固定,格子的内容是不会变化的,这个时候就相当于跳进了一个while(1)的循环中。而显然这样的推导是失败的,因为它始终不会有结果。通过禁止左递归,避免了跳转过程中出现某些环的问题。(并非不允许环的存在,只是因为在不读入字符的情况下的环会导致无限死循环,所以只能说是禁止了“有害的”环的存在。)
  2. 第二条解决了格子里放产生式的数量问题。只有在同一非终结符、同一输入字符的时候,才会出现多个产生式放在同一格子的问题。预测分析表的部分生成工作可以看作这么一个过程:
    FOR <EVERY Non-terminal P>
      FOR <EVERY Pattern α IN Production P->α1|α2|...>
          FOR <EVERY Terminal e IN FIRST(α)>
              prediction_table[P][e] = P->α

    其中P表示任意非终结符,α表示P的任意单个产生式右部,e表示α的FIRST集合里的任意元素(显然是终结符)。这么一看很容易发现,表格只有二维,而循环有三层,按照概率学的角度来说,肯定是允许在不同的α取值中,遇到同一个e的(即允许不同推导右侧的FIRST集合里有相同终结符)。从程序的角度上来说,格子里的原值要被覆盖,因为设计时是要求能够根据P和e唯一确定一个操作的;而从语法的角度上来说,格子的原值要保留,因为这代表了一条语法规则,覆盖的话会导致语法发生变化。这就产生了矛盾。所以,为了从根本上避免该情况的产生,要求在语法设计时就要避免格子出现重复赋值的问题。回到上面,不难发现解决方法之一就是要求不同的FIRST(α)里面不能有相同的e。而用专业术语来表达的话,这正是第二条规则。

  3. 第三条同样解决了格子里放产生式数量的问题。实际上,FOLLOW集合同样是要在预测分析表里放产生式。FOLLOW集合的目的是,告诉预测分析程序,在允许使用ε(即空字)合法结束当前产生式推导的同时,保证会有下一产生式,能够从当前的输入字符开始,开始新的推导。因而同样要在预测分析表里插入标记以指导跳转:
    FOR <EVERY Non-terminal P>
      IF <EXISTS P->ε>
          FOR <EVERY Terminal e IN FOLLOW(P)>
              prediction_table[P][e] = P->ε

    相比于第二条中的工作,这里只有两层循环,因而工作内部不会出现任何问题(因为根据集合的性质,空集作为元素是不可能重复的呀)。但是该段代码与第二条中操作的是同一个预测分析表啊!因而又可能出现格子覆盖的问题。显然,解决方法又是只要两者没有相同的e就行了。这里的两者指的是FOLLOW(P)和FIRST(P)。虽然第二条的代码段中使用的是FIRST(αi),但是在认为所有元素都等价的时候(即不需要再区分每个e对应的α),完全可以算一下,FIRST(αi)并起来就是FIRST(P)。(甚至不用算好吧)

今天来当当自己的课代表:

  1. “文法没有左递归”解决了在预测分析表中无限循环跳转的问题;
  2. 对于P->α1|α2|...∩(αi)=∅解决了在一个预测分析表里放多个非空产生式的冲突问题;
  3. 对于存在P->εFIRST(P) ∩ FOLLOW(P)=∅解决了在一个预测分析表里空产生式与非空产生式的冲突问题。

Windows的局域网文件共享用的是SMB服务,使用139和445这两个端口。(没错,就是WannaCry最喜欢的那个)

之前被WannaCry病毒搞怕了,于是手动建立了两条防火墙规则,屏蔽了139和445端口的TCP和UDP连接,而最近需要局域网传文件,又得把这个服务打开。

开了之后结果没有任何反应,用局域网ip访问自己都说是远程服务器不响应连接。然后telnet了一下,连接失败。后来考虑看看是不是服务的问题,用了本地回环地址,结果居然能telnet连接,更是可以用资源管理器访问。然后由于有局域网远程连接的需要,有线网卡上配置了一个单独的网段,结果用这个ip可以访问到共享文件。(emm,日常上网用的是无线网卡)

然后咕果上查了一大堆,有以下几个解决方案:

  1. 检查Server和Workstation服务;
  2. 检查Lanmanserver服务;
  3. 检查Print Spooler服务;
  4. 重启网卡服务协议。

除开2看起来不像是Windows自带的服务之外,其余的依次从头到尾试了一遍。最后一个重启网卡服务协议是啥呢,一个在巨硬论坛上找到的邪门方法。说是先把网卡-属性-Microsoft网络的文件和打印机共享勾去掉,保存,再重新点进来勾上就好了。但是在我的实际使用过程中,并未奏效。到是啥呢,顺手禁用然后重新启用了一下网卡,然后就可以访问了。

然后就可以访问了。

??????

然后就可以访问了???这是什么神仙操作???

(顺便说一句,在测试各种解决方案之前重启过很多次计算机,然而并没有用)

最近在做视频帧处理(前景提取),显然这个要求视频帧按照顺序输出。帧的处理顺序没有关系,因为没有使用推测功能。(要是开了帧预测的话,显然就只能顺序处理了,由于帧之间有依赖关系,所以最多只能做单帧内部的处理优化)

所以本次的思路基本是,寻找一个可以乱序执行,但是一定要能够按照任务的加入顺序获取执行结果的模型。看了一下,直接用threading.Thread,没有看到简洁地获取执行结果的方法;而用multithreading.pool.Pool,使用map函数的callback参数注册回调,在之前的尝试中没有成功过。然后在StackOverflow上看到有人推荐concurrent.futures.ThreadPoolExecutor。在Python里看到future这个词往往都是有惊喜的,这次也不例外。大致流程如下:

使用pool = ThreadPoolExecutor(maxThreadCount)注册一个全新的线程池 -> 使用pool.submit(function, args...)提交一个任务,并获得类似于线程句柄一类的返回对象,可以用来控制线程,包括在运行之前取消该任务、获取运行状态(是否完成)以及获取完成的返回值等。这几乎满足了之前提出的需求:只需要再自建一个满足先进先出的队列,就可以实现按帧的顺序读取了。

框架大致如下:

import multiprocessing as mp
from threading import Thread
from concurrent.futures import ProcessPoolExecutor

processPool = ProcessPoolExecutor(max(mp.cpu_count(), 1))
procList = []
maxQueueLength = 10

def produce(...):
    # 用来执行具体工作,比如处理单帧视频
    ...

def producer_func(...):
    # 用来控制多线程生成和执行情况的“主线程”,调用produce函数
    <condition-loop>
        ....
        # 确保队列不会过长,节省资源,时间换空间
        while len(procList) > maxQueueLength:
            continue
        procList.append(processPool.submit(produce, (...)))

if __name__ == '__main__':
    # 不阻塞主线程,将后续的任务还要放在这里执行,比如图像的显示
    Thread(target=producer_func, ...).start()

    while True:
        if len(procList) <= 0:
            continue
        elif not procList[0].done():
            continue
        res = procList[0].result()
        ...
        if <condition>:
            break

需求:一条语句从(0,1,2,3,4,5,6,7,8,9,10)中取出(7,5,3)

分析:可以使用Python的切片功能。

完整用法:iteratableObj[startIndex:endIndex:step]

其中iteratableObj可以是list, tuple,其他的我就不清楚了。(没去查官方文档= =)

然后startIndex为包含性的从0开始的元素编号,表示切片的开始位置;endIndex为非包含性的从0开始的元素编号,表示切片的结束位置;step表示步进,即每次前进多少个元素,默认为1。

这些数字如果是负数的话,也是有特定含义的,会被Python解释器认为是反向编址的序号,即常说的倒数第几个。相应地,step处的负号会让整个列表翻转。然后这里就涉及了一个很有意思的问题:同时进行切片和翻转,到底谁先谁后?也就是说,startIndexendIndex到底应该是填顺序的还是反序的?

经过实践,发现顺序如下:

  1. 先检查step的符号,如果为负,翻转列表(也可能是将读取顺序标记为反序)
  2. 按照startIndexstep开始选取元素,以endIndex为界限(不包含)。这里的两个index都还是顺序的!

于是上文的题目解答如下:

arr = (0,1,2,3,4,5,6,7,8,9,10)
print(arr[7:2:-2]) # or print(arr[-4:-9:-2])

千万要记住这里的第二个地址还是不包含的,所以一定要多顺着方向将地址+1!

在初步接触Java Servlet之后,会发现一个HTTPServlet有这么两个附属对象:ServletConfigServletContext,两者长得很像,又有着不少相同的方法(getAttribute(), getInitParameter(), getServletName()/getServletNames()),在网上搜了一下,发现有讲述两者之间的区别的博客,但是我是在理解之后才看懂的。。

在此简述一下使用Tomcat运行Web服务的三大主要层次,我依次将其命名为Server, Application和Servlet。其中Server指的是Tomcat本身,可以理解为一台服务器上一般只会跑一个Tomcat,所有需要借助Tomcat实现的Web服务都会依赖于这一个Tomcat实例。其次就是Application了,这就是上面所说,需要借助Tomcat实现的服务。一个Web服务就是一个Web项目,内部可以有复杂的Java逻辑代码,可以包括与数据库交互,等等。一个Servlet指的是提供单一Web功能的程序单位。

Application举例说明的话就是登陆系统,从登陆到连接后台,查看数据,修改用户信息、密码等,算是一个完整的后台管理系统服务,仅靠单一的URL是很难(但是是可以)实现整个功能的,起码作为一个便于维护和扩展的项目来说,都会需要多个URL来实现不同的功能,因为这样至少光靠URL地址就能有效地组织整合不同的功能了。这是Application。而Servlet实现的是原子操作,比如说后台管理系统中的登陆,或是获取用户信息,或是修改密码这种单一而清晰的任务。

然后就可以说明了:ServletConfig是Servlet层面的,每个Servlet都有自己独立的ServletConfig;而ServletContext是Application层面的,同一服务/项目下的所有Servlet可以通过ServletContext共享数据。那为什么ServletContext不是Server层面呢?ServletContext中可以存放应用的重要数据,出于安全考虑,一是防止数据窃取,二是防止篡改,不论是无意还是有意。

再仔细看看ServletContext的方法的话,会发现有一个方法名为getServletNames(),返回的是一个Enumeration,也就是说具有多个Servlet名称。相对地,ServletConfig的方法名为getServletName(),返回一个String。这下就更加清晰了,显然一个Servlet只应该有一个名字,那么ServletContext肯定就是Servlet层面之上的了。

此外有一个小坑:声明Application级别的初始变量是在web-app建立context-param子节点,使用ServletContextgetInitParameter()方法获取;Servlet级别的初始变量则需要在web-app节点下先新建servlet子节点,再在servlet子节点下新建init-param节点定义,使用ServletConfiggetInitParameter()方法获取。其中两个param的定义结构相同,使用param-name子节点定义变量名,param-value子节点定义变量值,而显然这个值只能定义为String类型。

例如:

<?xml version="1.0" encoding="UTF-8"?>
<web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="http://xmlns.jcp.org/xml/ns/javaee" xsi:schemaLocation="http://xmlns.jcp.org/xml/ns/javaee http://xmlns.jcp.org/xml/ns/javaee/web-app_4_0.xsd" id="WebApp_ID" version="4.0">

  ...

  <context-param>
    <param-name>contextInitParam</param-name>
    <param-value>someValue</param-value>
  </context-param>

  <servlet>
    <servlet-name>demoServlet</servlet-name>
    <servlet-class>tk.esperz.demoServlet</servlet-class>
    <load-on-startup>1</load-on-startup>
    <init-param>
      <param-name>servletInitParam</param-name>
      <param-value>otherServletsCannotSeeMe</param-value>
    </init-param>
  </servlet>
  <servlet-mapping>
     <servlet-name>demoServlet</servlet-name>
     <url-pattern>/demo.do</url-pattern>
  </servlet-mapping>
</web-app>

其中为该Web项目定义了一个名为contextInitParam的上下文初始化变量,值为someValue,所有该项目中的Servlet都可以通过ServletContext.getInitParameter("contextInitParam")获取;为名为demoServlet的Servlet定义了一个名为servletInitParam的初始化变量,值为otherServletsCannotSeeMe,仅在该Servlet内可以通过ServletConfig.getInitParameter("servletInitParam")获取。凡是用错了方法的都会返回null